CramNet: Camera-Radar Fusion with Ray-Constrained Cross-Attention for Robust 3D Object Detection


安全な自動運転には、堅牢な 3D オブジェクト検出が不可欠です。
カメラ センサーとレーダー センサーは、補完的な情報を取得し、さまざまな環境条件下で適切に機能するため、相乗効果があります。
カメラとレーダーのマッチング ネットワーク CramNet を提案します。これは、カメラとレーダーからのセンサー読み取り値を結合 3D 空間で融合するための効率的なアプローチです。
レーダー無線周波数画像を提供する数少ない大規模データセットの 1 つである RADIATE データセットでの広範な実験を通じて、融合アプローチの有効性を実証します。
私たちの方法のカメラのみのバリアントは、Waymo Open Dataset での単眼 3D オブジェクト検出で競争力のあるパフォーマンスを達成します。


Robust 3D object detection is critical for safe autonomous driving. Camera and radar sensors are synergistic as they capture complementary information and work well under different environmental conditions. Fusing camera and radar data is challenging, however, as each of the sensors lacks information along a perpendicular axis, that is, depth is unknown to camera and elevation is unknown to radar. We propose the camera-radar matching network CramNet, an efficient approach to fuse the sensor readings from camera and radar in a joint 3D space. To leverage radar range measurements for better camera depth predictions, we propose a novel ray-constrained cross-attention mechanism that resolves the ambiguity in the geometric correspondences between camera features and radar features. Our method supports training with sensor modality dropout, which leads to robust 3D object detection, even when a camera or radar sensor suddenly malfunctions on a vehicle. We demonstrate the effectiveness of our fusion approach through extensive experiments on the RADIATE dataset, one of the few large-scale datasets that provide radar radio frequency imagery. A camera-only variant of our method achieves competitive performance in monocular 3D object detection on the Waymo Open Dataset.


著者 Jyh-Jing Hwang,Henrik Kretzschmar,Joshua Manela,Sean Rafferty,Nicholas Armstrong-Crews,Tiffany Chen,Dragomir Anguelov
発行日 2022-10-18 01:46:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV, cs.LG, cs.RO パーマリンク