MultiCorrupt: A Multi-Modal Robustness Dataset and Benchmark of LiDAR-Camera Fusion for 3D Object Detection

要約

自動運転用のマルチモーダル 3D 物体検出モデルは、nuScenes などのコンピューター ビジョン ベンチマークで優れたパフォーマンスを実証しています。
ただし、高密度にサンプリングされた LiDAR 点群と細心の注意を払って調整されたセンサー アレイに依存しているため、現実世界のアプリケーションには課題が生じています。
センサーの位置ずれ、校正ミス、サンプリング周波数の違いなどの問題により、LiDAR やカメラからのデータの空間的および時間的な位置ずれが生じます。
さらに、LiDAR とカメラのデータの整合性は、悪天候などの悪環境条件によって損なわれることが多く、オクルージョンやノイズ干渉が発生します。
この課題に対処するために、10 種類の破損に対するマルチモーダル 3D オブジェクト検出器の堅牢性を評価するように設計された包括的なベンチマークである MultiCorrupt を導入します。
私たちは、MultiCorrupt 上の 5 つの最先端のマルチモーダル検出器を評価し、耐性能力の観点からそのパフォーマンスを分析します。
私たちの結果は、既存の方法が破損の種類とその融合戦略に応じてさまざまな程度の堅牢性を示すことを示しています。
私たちは、どのようなマルチモーダル設計の選択により、そのようなモデルが特定の摂動に対して堅牢になるかについての洞察を提供します。
データセット生成コードとベンチマークは、https://github.com/ika-rwth-aachen/MultiCorrupt でオープンソース化されています。

要約(オリジナル)

Multi-modal 3D object detection models for automated driving have demonstrated exceptional performance on computer vision benchmarks like nuScenes. However, their reliance on densely sampled LiDAR point clouds and meticulously calibrated sensor arrays poses challenges for real-world applications. Issues such as sensor misalignment, miscalibration, and disparate sampling frequencies lead to spatial and temporal misalignment in data from LiDAR and cameras. Additionally, the integrity of LiDAR and camera data is often compromised by adverse environmental conditions such as inclement weather, leading to occlusions and noise interference. To address this challenge, we introduce MultiCorrupt, a comprehensive benchmark designed to evaluate the robustness of multi-modal 3D object detectors against ten distinct types of corruptions. We evaluate five state-of-the-art multi-modal detectors on MultiCorrupt and analyze their performance in terms of their resistance ability. Our results show that existing methods exhibit varying degrees of robustness depending on the type of corruption and their fusion strategy. We provide insights into which multi-modal design choices make such models robust against certain perturbations. The dataset generation code and benchmark are open-sourced at https://github.com/ika-rwth-aachen/MultiCorrupt.

arxiv情報

著者 Till Beemelmanns,Quan Zhang,Lutz Eckstein
発行日 2024-03-29 12:34:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク