BEVHeight: A Robust Framework for Vision-based Roadside 3D Object Detection


タイトル:Vision-based Roadside 3D Object Detectionのための堅牢なフレームワークであるBEVHeight

– 自動運転システムの多くは、自己車両のセンサーに対する知覚方法の開発に焦点を当てているが、賢明なロードサイドカメラを利用して視覚範囲を超えた知覚能力を拡張する代替手段を見落としている人々が多い。
– 最新のビジョン中心の鳥瞰図検出方法は、道路脇のカメラでは性能が劣ることが分かった。
– この論文では、カメラ中心での車両と地面の高さの差が距離が増えるにつれて急速に縮小するため、ピクセルごとの深さを予測する代わりに、地面の高さに回帰させることでカメラのみの知覚方法の最適化プロセスを容易にすることを提案する。
– ロードサイドカメラの人気のある3D検出ベンチマークで、BEVHeightは全ての以前のビジョン中心の方法を大幅に上回る。
– コードは{\url{}}で入手可能。


While most recent autonomous driving system focuses on developing perception methods on ego-vehicle sensors, people tend to overlook an alternative approach to leverage intelligent roadside cameras to extend the perception ability beyond the visual range. We discover that the state-of-the-art vision-centric bird’s eye view detection methods have inferior performances on roadside cameras. This is because these methods mainly focus on recovering the depth regarding the camera center, where the depth difference between the car and the ground quickly shrinks while the distance increases. In this paper, we propose a simple yet effective approach, dubbed BEVHeight, to address this issue. In essence, instead of predicting the pixel-wise depth, we regress the height to the ground to achieve a distance-agnostic formulation to ease the optimization process of camera-only perception methods. On popular 3D detection benchmarks of roadside cameras, our method surpasses all previous vision-centric methods by a significant margin. The code is available at {\url{}}.


著者 Lei Yang,Kaicheng Yu,Tao Tang,Jun Li,Kun Yuan,Li Wang,Xinyu Zhang,Peng Chen
発行日 2023-04-11 07:19:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.CV パーマリンク