CompleteDT: Point Cloud Completion with Dense Augment Inference Transformers

要約

ポイントクラウド完了タスクは、不完全なポイントクラウドの欠落部分を予測し、詳細を含む完全なポイントクラウドを生成することを目的としています。
本論文では、新しい点群補完ネットワーク、すなわちCompleteDTを提案する。
具体的には、特徴は、不完全な入力からサンプリングされたさまざまな解像度の点群から学習され、幾何学的構造に基づいて一連の\textit{spots}に変換されます。
次に、トランスフォーマーに基づくDense Relation Augment Module(DRA)を提案して、\ textit {spots}内の機能を学習し、これらの\textit{spots}間の相関を検討します。
DRAは、Point Local-Attention Module(PLA)とPoint Dense Multi-Scale Attention Module(PDMA)で構成され、PLAは、ネイバーの重みを適応的に測定することによってローカルの\ textit {spots}内のローカル情報をキャプチャし、PDMAは
マルチスケールの密に接続された方法でのこれらの\textit{spots}間のグローバルな関係。
最後に、完全な形状は、マルチ解像度ポイントフュージョンモジュール(MPF)によって\ textit {spots}から予測されます。このモジュールは、\ textit {spots}から完全なポイントクラウドを徐々に生成し、これらの生成されたポイントに基づいて\textit{spots}を更新します。
雲。
実験結果は、トランスフォーマーに基づくDRAが不完全な入力から表現力のある特徴を学習でき、MPFがこれらの特徴を完全に探索して完全な入力を予測できるため、私たちの方法は最先端の方法よりも大幅に優れていることを示しています。

要約(オリジナル)

Point cloud completion task aims to predict the missing part of incomplete point clouds and generate complete point clouds with details. In this paper, we propose a novel point cloud completion network, namely CompleteDT. Specifically, features are learned from point clouds with different resolutions, which is sampled from the incomplete input, and are converted to a series of \textit{spots} based on the geometrical structure. Then, the Dense Relation Augment Module (DRA) based on the transformer is proposed to learn features within \textit{spots} and consider the correlation among these \textit{spots}. The DRA consists of Point Local-Attention Module (PLA) and Point Dense Multi-Scale Attention Module (PDMA), where the PLA captures the local information within the local \textit{spots} by adaptively measuring weights of neighbors and the PDMA exploits the global relationship between these \textit{spots} in a multi-scale densely connected manner. Lastly, the complete shape is predicted from \textit{spots} by the Multi-resolution Point Fusion Module (MPF), which gradually generates complete point clouds from \textit{spots}, and updates \textit{spots} based on these generated point clouds. Experimental results show that, because the DRA based on the transformer can learn the expressive features from the incomplete input and the MPF can fully explore these feature to predict the complete input, our method largely outperforms the state-of-the-art methods.

arxiv情報

著者 Jun Li,Shangwei Guo,Shaokun Han
発行日 2022-06-10 10:10:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク