APPT : Asymmetric Parallel Point Transformer for 3D Point Cloud Understanding




– 3Dポイントクラウド理解においてトランスフォーマーを使用することにより著しい性能が出ています。
– しかし、ほとんどの手法が局所的な特徴の集約に集中しており、直接的なグローバル依存性をモデル化することを無視するため、効果的な受容野が限られます。
– さらに、局所とグローバルの要素を効果的に統合する方法も未だ挑戦的な課題のままです。
– これらの問題に対処するために、非対称並列ポイントトランスフォーマー(APPT)を提案します。
– 特に、グローバルピボットアテンションを導入してグローバル特徴を抽出し、効果的な受容野を拡大します。
– さらに、非対称並列構造を設計して、局所的な詳細特徴にフォーカスしながら全体的に特徴を捉えることができます。
– これらの設計と組み合わせることで、APPTはネットワーク全体でグローバルに特徴をキャプチャし、局所的な詳細特徴に焦点を当てることができます。
– 大規模な実験では、APPTが従来法を上回り、3Dセマンティックセグメンテーション(S3DIS)、3D形状分類(ModelNet40)、および3Dパーツセグメンテーション(ShapeNet)などのいくつかのベンチマークで最先端の成果を達成することが示されました。


Transformer-based networks have achieved impressive performance in 3D point cloud understanding. However, most of them concentrate on aggregating local features, but neglect to directly model global dependencies, which results in a limited effective receptive field. Besides, how to effectively incorporate local and global components also remains challenging. To tackle these problems, we propose Asymmetric Parallel Point Transformer (APPT). Specifically, we introduce Global Pivot Attention to extract global features and enlarge the effective receptive field. Moreover, we design the Asymmetric Parallel structure to effectively integrate local and global information. Combined with these designs, APPT is able to capture features globally throughout the entire network while focusing on local-detailed features. Extensive experiments show that our method outperforms the priors and achieves state-of-the-art on several benchmarks for 3D point cloud understanding, such as 3D semantic segmentation on S3DIS, 3D shape classification on ModelNet40, and 3D part segmentation on ShapeNet.


著者 Hengjia Li,Tu Zheng,Zhihao Chi,Zheng Yang,Wenxiao Wang,Boxi Wu,Binbin Lin,Deng Cai
発行日 2023-03-31 06:11:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.CV パーマリンク