Grid-Centric Traffic Scenario Perception for Autonomous Driving: A Comprehensive Review

要約

グリッド中心の認識は、移動ロボットの認識とナビゲーションにとって重要な分野です。
それにもかかわらず、自動運転車は非常に動的で大規模な交通シナリオを正確に認識する必要があり、グリッド中心の認識の複雑さと計算コストが高いため、グリッド中心の認識はオブジェクト中心の認識ほど普及していません。
近年、深層学習技術とハードウェアの急速な発展により、グリッド中心の認識の進化について新たな洞察が得られています。
グリッド中心のパイプラインとオブジェクト中心のパイプラインの基本的な違いは、グリッド中心の認識は、意味的に不明な障害物が延々と続くオープンワールドの運転シナリオに対してより堅牢な、ジオメトリ優先パラダイムに従っていることにあります。
最近の研究では、包括的なきめの細かい環境表現、オクルージョンや不規則な形状の物体に対する堅牢性の向上、より優れた地盤推定、より安全な計画ポリシーなど、グリッド中心の認識の大きな利点が実証されています。
また、占有ネットワークの能力が 4D シーンの認識と予測にまで大幅に拡張される傾向が強まっており、最新の技術は、4D 占有予測、生成 AI、自動運転分野の世界モデルなどの新しい研究テーマと密接に関連しています。
この急速に拡大する分野に関する現在の調査が不足していることを考慮して、自動運転車に対するグリッド中心の認識についての階層構造のレビューを紹介します。
私たちは、2D BEV グリッドから 3D 占有率、4D 占有率予測までの主要な流れに沿って、占有グリッド技術に関する以前と現在の知識を整理します。
さらに、ラベル効率の高い占有学習と、駆動システムにおけるグリッド中心の認識の役割についてもまとめます。
最後に、現在の研究動向をまとめ、今後の展望を示します。

要約(オリジナル)

Grid-centric perception is a crucial field for mobile robot perception and navigation. Nonetheless, grid-centric perception is less prevalent than object-centric perception as autonomous vehicles need to accurately perceive highly dynamic, large-scale traffic scenarios and the complexity and computational costs of grid-centric perception are high. In recent years, the rapid development of deep learning techniques and hardware provides fresh insights into the evolution of grid-centric perception. The fundamental difference between grid-centric and object-centric pipeline lies in that grid-centric perception follows a geometry-first paradigm which is more robust to the open-world driving scenarios with endless long-tailed semantically-unknown obstacles. Recent researches demonstrate the great advantages of grid-centric perception, such as comprehensive fine-grained environmental representation, greater robustness to occlusion and irregular shaped objects, better ground estimation, and safer planning policies. There is also a growing trend that the capacity of occupancy networks are greatly expanded to 4D scene perception and prediction and latest techniques are highly related to new research topics such as 4D occupancy forecasting, generative AI and world models in the field of autonomous driving. Given the lack of current surveys for this rapidly expanding field, we present a hierarchically-structured review of grid-centric perception for autonomous vehicles. We organize previous and current knowledge of occupancy grid techniques along the main vein from 2D BEV grids to 3D occupancy to 4D occupancy forecasting. We additionally summarize label-efficient occupancy learning and the role of grid-centric perception in driving systems. Lastly, we present a summary of the current research trend and provide future outlooks.

arxiv情報

著者 Yining Shi,Kun Jiang,Jiusi Li,Zelin Qian,Junze Wen,Mengmeng Yang,Ke Wang,Diange Yang
発行日 2024-06-09 12:58:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク