PatchMixer: Rethinking network design to boost generalization for 3D point cloud understanding


3D 点群を理解するためのディープ ラーニング手法の最近の傾向は、3D ジオメトリをより適切にキャプチャするため、またはおそらく望ましくない誘導バイアスを導入することによって、ますます洗練されたアーキテクチャを提案することです。
私たちは、学習した知識をさまざまなドメインに転送するモデルの機能は、ディープ ネットワーク アーキテクチャの品質を徹底的に評価するために評価されるべき重要な機能であると主張します。
この研究では、最近の MLP-Mixer 論文の背後にあるアイデアを 3D 点群に拡張する、シンプルだが効果的なアーキテクチャである PatchMixer を提案します。
私たちのアプローチの新規性は、部分的な点群に対するロバスト性を促進するために形状全体ではなく局所的なパッチを処理することと、使用されるグラフ畳み込みやアテンション メカニズムのより簡単な代替として MLP を使用してパッチごとの特徴を集約することです。
私たちは、形状分類と部品セグメンテーション タスクに関する手法を評価し、最も関連性の高いディープ アーキテクチャの選択と比較して優れた汎化パフォーマンスを達成しました。


The recent trend in deep learning methods for 3D point cloud understanding is to propose increasingly sophisticated architectures either to better capture 3D geometries or by introducing possibly undesired inductive biases. Moreover, prior works introducing novel architectures compared their performance on the same domain, devoting less attention to their generalization to other domains. We argue that the ability of a model to transfer the learnt knowledge to different domains is an important feature that should be evaluated to exhaustively assess the quality of a deep network architecture. In this work we propose PatchMixer, a simple yet effective architecture that extends the ideas behind the recent MLP-Mixer paper to 3D point clouds. The novelties of our approach are the processing of local patches instead of the whole shape to promote robustness to partial point clouds, and the aggregation of patch-wise features using an MLP as a simpler alternative to the graph convolutions or the attention mechanisms that are used in prior works. We evaluated our method on the shape classification and part segmentation tasks, achieving superior generalization performance compared to a selection of the most relevant deep architectures.


著者 Davide Boscaini,Fabio Poiesi
発行日 2023-07-28 17:37:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV パーマリンク