A Survey on Occupancy Perception for Autonomous Driving: The Information Fusion Perspective

要約

3D 乗員認識テクノロジーは、自動運転車の高密度 3D 環境を観察して理解することを目的としています。
この技術は、その包括的な認識機能により、自動運転認識システムのトレンドとして浮上しており、産業界と学術界の両方から大きな注目を集めています。
従来の鳥瞰図 (BEV) 知覚と同様に、3D 占有知覚にはマルチソース入力の性質があり、情報融合の必要性があります。
ただし、違いは、2D BEV では無視される垂直構造を捕捉することです。
この調査では、3D 占有知覚に関する最新の研究をレビューし、さまざまな入力モダリティを使用した方法論の詳細な分析を提供します。
具体的には、一般的なネットワーク パイプラインを要約し、情報融合手法に焦点を当て、効果的なネットワーク トレーニングについて説明します。
私たちは、最も一般的なデータセットに対する最先端の占有知覚パフォーマンスを評価および分析します。
さらに、課題と将来の研究の方向性についても議論します。
このレポートがコミュニティにインスピレーションを与え、3D 占有知覚に関するさらなる研究活動を奨励することを願っています。
この調査の包括的な研究リストは、最新の成果を継続的に収集するアクティブなリポジトリ https://github.com/HuaiyuanXu/3D-Occupancy-Perception で入手できます。

要約(オリジナル)

3D occupancy perception technology aims to observe and understand dense 3D environments for autonomous vehicles. Owing to its comprehensive perception capability, this technology is emerging as a trend in autonomous driving perception systems, and is attracting significant attention from both industry and academia. Similar to traditional bird’s-eye view (BEV) perception, 3D occupancy perception has the nature of multi-source input and the necessity for information fusion. However, the difference is that it captures vertical structures that are ignored by 2D BEV. In this survey, we review the most recent works on 3D occupancy perception, and provide in-depth analyses of methodologies with various input modalities. Specifically, we summarize general network pipelines, highlight information fusion techniques, and discuss effective network training. We evaluate and analyze the occupancy perception performance of the state-of-the-art on the most popular datasets. Furthermore, challenges and future research directions are discussed. We hope this report will inspire the community and encourage more research work on 3D occupancy perception. A comprehensive list of studies in this survey is available in an active repository that continuously collects the latest work: https://github.com/HuaiyuanXu/3D-Occupancy-Perception.

arxiv情報

著者 Huaiyuan Xu,Junliang Chen,Shiyu Meng,Yi Wang,Lap-Pui Chau
発行日 2024-05-08 16:10:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.RO パーマリンク