Goal-oriented Autonomous Driving

要約

最新の自動運転システムは、認識、予測、計画という順序でモジュール化されたタスクとして特徴付けられます。
センサーとハードウェアが改善されるにつれて、より高度なインテリジェンスを実現するために幅広いタスクを実行できるシステムを考案する傾向があります。
現代のアプローチでは、個々のタスクにスタンドアロン モデルを展開するか、個別のヘッドを使用してマルチタスク パラダイムを設計する必要があります。
これらは、累積エラーまたは負の転送効果に悩まされる可能性があります。
代わりに、最終的な目標、つまり自動運転車の計画を追求するために、好ましいアルゴリズムのフレームワークを考案して最適化する必要があると主張します。
この目標に向けて、認識と予測の主要な構成要素を再検討します。
各モジュールを分析し、タスクを階層的に優先順位付けして、これらすべてのタスクが計画 (目標) に貢献するようにします。
この目的のために、統合自動運転 (UniAD) を導入します。これは、フルスタックの運転タスクを 1 つのネットワークに組み込んだ最新の包括的なフレームワークです。
各モジュールの利点を活用し、グローバルな観点からエージェントの相互作用に補完的な機能の抽象化を提供するように精巧に考案されています。
タスクは、統合されたクエリ設計で伝達され、計画に向けて互いに促進されます。
挑戦的な nuScenes ベンチマークで UniAD をインスタンス化します。
大規模なアブレーションにより、そのような哲学を使用することの有効性は、あらゆる面で以前の最先端技術を大幅に上回ることが証明されています。
コミュニティでの将来の研究を容易にするために、コードベースとモデルの完全なスイートが利用可能になります。

要約(オリジナル)

Modern autonomous driving system is characterized as modular tasks in sequential order, i.e., perception, prediction and planning. As sensors and hardware get improved, there is trending popularity to devise a system that can perform a wide diversity of tasks to fulfill higher-level intelligence. Contemporary approaches resort to either deploying standalone models for individual tasks, or designing a multi-task paradigm with separate heads. These might suffer from accumulative error or negative transfer effect. Instead, we argue that a favorable algorithm framework should be devised and optimized in pursuit of the ultimate goal, i.e. planning of the self-driving-car. Oriented at this goal, we revisit the key components within perception and prediction. We analyze each module and prioritize the tasks hierarchically, such that all these tasks contribute to planning (the goal). To this end, we introduce Unified Autonomous Driving (UniAD), the first comprehensive framework up-to-date that incorporates full-stack driving tasks in one network. It is exquisitely devised to leverage advantages of each module, and provide complementary feature abstractions for agent interaction from a global perspective. Tasks are communicated with unified query design to facilitate each other toward planning. We instantiate UniAD on the challenging nuScenes benchmark. With extensive ablations, the effectiveness of using such a philosophy is proven to surpass previous state-of-the-arts by a large margin in all aspects. The full suite of codebase and models would be available to facilitate future research in the community.

arxiv情報

著者 Yihan Hu,Jiazhi Yang,Li Chen,Keyu Li,Chonghao Sima,Xizhou Zhu,Siqi Chai,Senyao Du,Tianwei Lin,Wenhai Wang,Lewei Lu,Xiaosong Jia,Qiang Liu,Jifeng Dai,Yu Qiao,Hongyang Li
発行日 2022-12-20 10:47:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク