KAN-RCBEVDepth: A multi-modal fusion algorithm in object detection for autonomous driving

要約

自動運転における正確な 3D オブジェクト検出は非常に重要ですが、オクルージョン、さまざまなオブジェクト サイズ、複雑な都市環境のため、困難を伴います。
この論文では、カメラ、LiDAR、ミリ波レーダーからのマルチモーダル センサー データを融合することで 3D 物体検出を強化することを目的とした革新的なアプローチである KAN-RCBEVDepth メソッドを紹介します。
当社の独自の鳥瞰図ベースのアプローチは、多様なセンサー入力をシームレスに統合し、空間関係の理解を洗練し、計算手順を最適化することで、検出の精度と効率を大幅に向上させます。
実験結果は、提案された方法が複数の検出メトリクスにわたって既存の手法を上回っており、より高い平均距離 AP (0.389、23\% 改善)、より優れた ND スコア (0.485、17.1\% 改善)、およびより高速な評価時間 (71.28% 向上) を達成していることを示しています。
s、8\% 高速化)。
さらに、KAN-RCBEVDepth メソッドは BEVDepth と比較して誤差を大幅に削減し、変換​​誤差 (0.6044、13.8\% 改善)、スケール誤差 (0.2780、2.6\% 改善)、方向誤差 (0.5830、7.6\% 改善)、速度が低くなります。
エラー (0.4244、28.3\% 改善)、および属性エラー (0.2129、3.2\% 改善)。
これらの発見は、私たちの方法が精度、信頼性、効率性を向上させ、動的で要求の厳しい自動運転シナリオに適していることを示唆しています。
コードは \url{https://github.com/laitiamo/RCBEVDepth-KAN} で公開されます。

要約(オリジナル)

Accurate 3D object detection in autonomous driving is critical yet challenging due to occlusions, varying object sizes, and complex urban environments. This paper introduces the KAN-RCBEVDepth method, an innovative approach aimed at enhancing 3D object detection by fusing multimodal sensor data from cameras, LiDAR, and millimeter-wave radar. Our unique Bird’s Eye View-based approach significantly improves detection accuracy and efficiency by seamlessly integrating diverse sensor inputs, refining spatial relationship understanding, and optimizing computational procedures. Experimental results show that the proposed method outperforms existing techniques across multiple detection metrics, achieving a higher Mean Distance AP (0.389, 23\% improvement), a better ND Score (0.485, 17.1\% improvement), and a faster Evaluation Time (71.28s, 8\% faster). Additionally, the KAN-RCBEVDepth method significantly reduces errors compared to BEVDepth, with lower Transformation Error (0.6044, 13.8\% improvement), Scale Error (0.2780, 2.6\% improvement), Orientation Error (0.5830, 7.6\% improvement), Velocity Error (0.4244, 28.3\% improvement), and Attribute Error (0.2129, 3.2\% improvement). These findings suggest that our method offers enhanced accuracy, reliability, and efficiency, making it well-suited for dynamic and demanding autonomous driving scenarios. The code will be released in \url{https://github.com/laitiamo/RCBEVDepth-KAN}.

arxiv情報

著者 Zhihao Lai,Chuanhao Liu,Shihui Sheng,Zhiqiang Zhang
発行日 2024-08-27 16:46:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク