Planning-oriented Autonomous Driving

要約

最新の自動運転システムは、認識、予測、計画という順序でモジュール化されたタスクとして特徴付けられます。
さまざまなタスクを実行し、高度なレベルのインテリジェンスを実現するために、最新のアプローチでは、個々のタスクにスタンドアロン モデルを展開するか、個別のヘッドを使用してマルチタスク パラダイムを設計します。
ただし、エラーが累積したり、タスクの調整が不十分になったりする可能性があります。
代わりに、最終的な目標、つまり自動運転車の計画を追求するために、好ましいフレームワークを考案して最適化する必要があると主張します。
これに向けて、認識と予測の主要なコンポーネントを再検討し、これらすべてのタスクが計画に貢献するようにタスクに優先順位を付けます。
フルスタックの運転タスクを 1 つのネットワークに組み込んだ最新の包括的なフレームワークである Unified Autonomous Driving (UniAD) を紹介します。
各モジュールの利点を活用し、グローバルな観点からエージェントの相互作用に補完的な機能の抽象化を提供するように精巧に考案されています。
タスクは、計画に向けて相互に促進するために、統一されたクエリ インターフェイスとやり取りされます。
挑戦的な nuScenes ベンチマークで UniAD をインスタンス化します。
大規模な切除により、このような哲学を使用することの有効性は、あらゆる面で以前の最先端技術を大幅に上回ることによって証明されています。
コードとモデルは公開されています。

要約(オリジナル)

Modern autonomous driving system is characterized as modular tasks in sequential order, i.e., perception, prediction, and planning. In order to perform a wide diversity of tasks and achieve advanced-level intelligence, contemporary approaches either deploy standalone models for individual tasks, or design a multi-task paradigm with separate heads. However, they might suffer from accumulative errors or deficient task coordination. Instead, we argue that a favorable framework should be devised and optimized in pursuit of the ultimate goal, i.e., planning of the self-driving car. Oriented at this, we revisit the key components within perception and prediction, and prioritize the tasks such that all these tasks contribute to planning. We introduce Unified Autonomous Driving (UniAD), a comprehensive framework up-to-date that incorporates full-stack driving tasks in one network. It is exquisitely devised to leverage advantages of each module, and provide complementary feature abstractions for agent interaction from a global perspective. Tasks are communicated with unified query interfaces to facilitate each other toward planning. We instantiate UniAD on the challenging nuScenes benchmark. With extensive ablations, the effectiveness of using such a philosophy is proven by substantially outperforming previous state-of-the-arts in all aspects. Code and models are public.

arxiv情報

著者 Yihan Hu,Jiazhi Yang,Li Chen,Keyu Li,Chonghao Sima,Xizhou Zhu,Siqi Chai,Senyao Du,Tianwei Lin,Wenhai Wang,Lewei Lu,Xiaosong Jia,Qiang Liu,Jifeng Dai,Yu Qiao,Hongyang Li
発行日 2023-03-23 16:26:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク