Far3D: Expanding the Horizon for Surround-view 3D Object Detection

要約

最近、サラウンドビュー画像からの 3D オブジェクト検出は、低い導入コストで顕著な進歩を遂げています。
しかし、ほとんどの研究は主に近距離の知覚範囲に焦点を当てており、長距離の検出はあまり検討されていません。
長距離をカバーするために既存の方法を直接拡張すると、膨大な計算コストや不安定な収束などの課題が生じます。
これらの制限に対処するために、この論文では、Far3D と呼ばれる新しいスパース クエリベースのフレームワークを提案します。
高品質の 2D オブジェクト事前分布を利用することで、3D グローバル クエリを補完する 3D 適応クエリを生成します。
長距離オブジェクトのさまざまなビューとスケールにわたる識別機能を効率的にキャプチャするために、遠近感を意識した集約モジュールを導入します。
さらに、クエリエラーの伝播に対処し、長距離タスクにおける収束の問題を軽減するために、範囲変調された 3D ノイズ除去アプローチを提案します。
重要なことに、Far3D は、150 メートルの広範囲をカバーし、いくつかの LiDAR ベースのアプローチを上回る、困難な Argoverse 2 データセット上で SoTA パフォーマンスを実証しています。
一方、Far3D は、nuScenes データセットに対する以前の方法と比較して優れたパフォーマンスを示します。
コードは https://github.com/megvii-research/Far3D で入手できます。

要約(オリジナル)

Recently 3D object detection from surround-view images has made notable advancements with its low deployment cost. However, most works have primarily focused on close perception range while leaving long-range detection less explored. Expanding existing methods directly to cover long distances poses challenges such as heavy computation costs and unstable convergence. To address these limitations, this paper proposes a novel sparse query-based framework, dubbed Far3D. By utilizing high-quality 2D object priors, we generate 3D adaptive queries that complement the 3D global queries. To efficiently capture discriminative features across different views and scales for long-range objects, we introduce a perspective-aware aggregation module. Additionally, we propose a range-modulated 3D denoising approach to address query error propagation and mitigate convergence issues in long-range tasks. Significantly, Far3D demonstrates SoTA performance on the challenging Argoverse 2 dataset, covering a wide range of 150 meters, surpassing several LiDAR-based approaches. Meanwhile, Far3D exhibits superior performance compared to previous methods on the nuScenes dataset. The code is available at https://github.com/megvii-research/Far3D.

arxiv情報

著者 Xiaohui Jiang,Shuailin Li,Yingfei Liu,Shihao Wang,Fan Jia,Tiancai Wang,Lijin Han,Xiangyu Zhang
発行日 2023-12-17 14:17:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク