KAN-RCBEVDepth: A multi-modal fusion algorithm in object detection for autonomous driving


自動運転における正確な 3D オブジェクト検出は非常に重要ですが、オクルージョン、さまざまなオブジェクト サイズ、複雑な都市環境のため、困難を伴います。
この論文では、カメラ、LiDAR、ミリ波レーダーからのマルチモーダル センサー データを融合することで 3D 物体検出を強化することを目的とした革新的なアプローチである KAN-RCBEVDepth メソッドを紹介します。
実験結果は、提案された方法が複数の検出メトリクスにわたって既存の手法を上回っており、より高い平均距離 AP (0.389、23\% 改善)、より優れた ND スコア (0.485、17.1\% 改善)、およびより高速な評価時間 (71.28% 向上) を達成していることを示しています。
s、8\% 高速化)。
さらに、KAN-RCBEVDepth メソッドは BEVDepth と比較して誤差を大幅に削減し、変換​​誤差 (0.6044、13.8\% 改善)、スケール誤差 (0.2780、2.6\% 改善)、方向誤差 (0.5830、7.6\% 改善)、速度が低くなります。
エラー (0.4244、28.3\% 改善)、および属性エラー (0.2129、3.2\% 改善)。
コードは \url{https://github.com/laitiamo/RCBEVDepth-KAN} で公開されます。


Accurate 3D object detection in autonomous driving is critical yet challenging due to occlusions, varying object sizes, and complex urban environments. This paper introduces the KAN-RCBEVDepth method, an innovative approach aimed at enhancing 3D object detection by fusing multimodal sensor data from cameras, LiDAR, and millimeter-wave radar. Our unique Bird’s Eye View-based approach significantly improves detection accuracy and efficiency by seamlessly integrating diverse sensor inputs, refining spatial relationship understanding, and optimizing computational procedures. Experimental results show that the proposed method outperforms existing techniques across multiple detection metrics, achieving a higher Mean Distance AP (0.389, 23\% improvement), a better ND Score (0.485, 17.1\% improvement), and a faster Evaluation Time (71.28s, 8\% faster). Additionally, the KAN-RCBEVDepth method significantly reduces errors compared to BEVDepth, with lower Transformation Error (0.6044, 13.8\% improvement), Scale Error (0.2780, 2.6\% improvement), Orientation Error (0.5830, 7.6\% improvement), Velocity Error (0.4244, 28.3\% improvement), and Attribute Error (0.2129, 3.2\% improvement). These findings suggest that our method offers enhanced accuracy, reliability, and efficiency, making it well-suited for dynamic and demanding autonomous driving scenarios. The code will be released in \url{https://github.com/laitiamo/RCBEVDepth-KAN}.


著者 Zhihao Lai,Chuanhao Liu,Shihui Sheng,Zhiqiang Zhang
発行日 2024-08-27 16:46:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク