要約
点群認識の現在のモデルは、合成データセット上で有望なパフォーマンスを示しています。
ただし、現実世界の点群データには必然的にノイズが含まれ、モデルの堅牢性に影響を与えます。
最近の取り組みは、さまざまな戦略を通じて堅牢性を強化することに焦点を当てていますが、ネットワーク アーキテクチャ設計の観点からの包括的な分析には依然として不足があります。
一般的な技術に依存する従来の方法とは異なり、私たちのアプローチは、ネットワーク アーキテクチャ設計を通じてノイズ破損に対するモデルの堅牢性を最適化します。
2D 画像に適用されるトークン混合技術にヒントを得て、私たちは Set-Mixer を提案します。これは、すべてのポイント間の通信を容易にして幾何学的形状情報を抽出し、個々のノイズ ポイントの影響を軽減する、ノイズに強い集約モジュールです。
ソート戦略は、モジュールが点の順列に対して不変であることを可能にするように設計されています。これにより、点群の順序性のない構造にも取り組み、一貫した相対空間情報が導入されます。
ModelNet40-C で行われた実験では、Set-Mixer がノイズの多い点群でのモデルのパフォーマンスを大幅に向上させることが示されており、3D 認識および知覚タスクにおける現実世界への適用性を高める可能性が強調されています。
要約(オリジナル)
Current models for point cloud recognition demonstrate promising performance on synthetic datasets. However, real-world point cloud data inevitably contains noise, impacting model robustness. While recent efforts focus on enhancing robustness through various strategies, there still remains a gap in comprehensive analyzes from the standpoint of network architecture design. Unlike traditional methods that rely on generic techniques, our approach optimizes model robustness to noise corruption through network architecture design. Inspired by the token-mixing technique applied in 2D images, we propose Set-Mixer, a noise-robust aggregation module which facilitates communication among all points to extract geometric shape information and mitigating the influence of individual noise points. A sorting strategy is designed to enable our module to be invariant to point permutation, which also tackles the unordered structure of point cloud and introduces consistent relative spatial information. Experiments conducted on ModelNet40-C indicate that Set-Mixer significantly enhances the model performance on noisy point clouds, underscoring its potential to advance real-world applicability in 3D recognition and perception tasks.
arxiv情報
著者 | Dingxin Zhang,Jianhui Yu,Tengfei Xue,Chaoyi Zhang,Dongnan Liu,Weidong Cai |
発行日 | 2024-07-15 15:21:34+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google