Learning a Task-specific Descriptor for Robust Matching of 3D Point Clouds

要約

既存の学習ベースの点特徴記述子は通常、タスクに依存せず、個々の 3D 点群を可能な限り正確に記述することを追求します。
ただし、マッチング タスクは、異なる 3D ポイント クラウド全体で一貫して対応するポイントを記述することを目的としています。
したがって、これらのあまりにも正確なフィーチャは、ローカル ジオメトリの予測不可能なノイズ、部分性、変形などによって引き起こされる対応の一貫性のないポイント フィーチャ表現により、逆効果になる可能性があります。
この論文では、堅牢なタス​​ク固有の特徴記述子を学習して、干渉下での正しい点対応を一貫して記述することを提案します。
エンコーダーとダイナミック フュージョン モジュールで生まれた、私たちの方法 EDFNet は 2 つの側面から開発されます。
まず、反復的な局所構造を利用して対応の一致性を高めます。
この目的のために、特別なエンコーダーは、各ポイント記述子に対して 2 つの入力ポイント クラウドを共同で利用するように設計されています。
畳み込みによって現在のポイント クラウド内の各ポイントのローカル ジオメトリをキャプチャするだけでなく、Transformer によってペアのポイント クラウドから反復構造を利用します。
次に、異なるスケール機能を併用する動的融合モジュールを提案します。
堅牢性と単一スケール機能の識別性との間には必然的な闘争があります。
具体的には、この小さな受容野にはほとんど干渉が存在しないため、小規模な機能はロバストです。
しかし、点群内には反復的な局所構造が多数存在するため、識別力は十分ではありません。
したがって、結果の記述子は、多くの不正確な一致につながります。
対照的に、大規模なフィーチャは、より多くの近隣情報を統合することで、より識別力が高くなります。

要約(オリジナル)

Existing learning-based point feature descriptors are usually task-agnostic, which pursue describing the individual 3D point clouds as accurate as possible. However, the matching task aims at describing the corresponding points consistently across different 3D point clouds. Therefore these too accurate features may play a counterproductive role due to the inconsistent point feature representations of correspondences caused by the unpredictable noise, partiality, deformation, \etc, in the local geometry. In this paper, we propose to learn a robust task-specific feature descriptor to consistently describe the correct point correspondence under interference. Born with an Encoder and a Dynamic Fusion module, our method EDFNet develops from two aspects. First, we augment the matchability of correspondences by utilizing their repetitive local structure. To this end, a special encoder is designed to exploit two input point clouds jointly for each point descriptor. It not only captures the local geometry of each point in the current point cloud by convolution, but also exploits the repetitive structure from paired point cloud by Transformer. Second, we propose a dynamical fusion module to jointly use different scale features. There is an inevitable struggle between robustness and discriminativeness of the single scale feature. Specifically, the small scale feature is robust since little interference exists in this small receptive field. But it is not sufficiently discriminative as there are many repetitive local structures within a point cloud. Thus the resultant descriptors will lead to many incorrect matches. In contrast, the large scale feature is more discriminative by integrating more neighborhood information. …

arxiv情報

著者 Zhiyuan Zhang,Yuchao Dai,Bin Fan,Jiadai Sun,Mingyi He
発行日 2022-10-26 17:57:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク