要約
安全、快適、効率的なナビゲーションを確保することは、自動運転システムにとって重要な目標です。
大規模なデータセットでトレーニングされたエンドツーエンドのモデルは、一般的な運転シナリオでは優れていますが、まれなロングテール イベントでは苦労することがよくあります。
大規模言語モデル (LLM) の最近の進歩により、推論機能が強化されましたが、その計算需要により、リアルタイムの意思決定と正確な計画に課題が生じています。
この論文では、認知モデル「Thinking、Fast and Slow」にインスピレーションを得た新しいデュアルシステム フレームワークである FASIONAD について説明します。
高速システムは、迅速なデータ主導の経路計画を使用して日常的なナビゲーション タスクを処理しますが、低速システムは、困難な状況や不慣れな状況での複雑な推論と意思決定に焦点を当てます。
スコアの分配とフィードバックに基づく動的な切り替えメカニズムにより、2 つのシステム間のシームレスな移行が可能になります。
高速システムによって生成される視覚的なプロンプトにより、低速システムでも人間のような推論が可能になり、高速システムの意思決定を強化する高品質のフィードバックが提供されます。
FASIONAD を評価するために、nuScenes データセットから派生した新しいベンチマークを導入します。これは、特に高速シナリオと低速シナリオを区別するように設計されています。
FASIONAD は、このベンチマークで最先端のパフォーマンスを達成し、自動運転における高速認知プロセスと低速認知プロセスを統合するフレームワークの新しい標準を確立します。
このアプローチは、より適応性が高く、人間に似た自動運転システムへの道を切り開きます。
要約(オリジナル)
Ensuring safe, comfortable, and efficient navigation is a critical goal for autonomous driving systems. While end-to-end models trained on large-scale datasets excel in common driving scenarios, they often struggle with rare, long-tail events. Recent progress in large language models (LLMs) has introduced enhanced reasoning capabilities, but their computational demands pose challenges for real-time decision-making and precise planning. This paper presents FASIONAD, a novel dual-system framework inspired by the cognitive model ‘Thinking, Fast and Slow.’ The fast system handles routine navigation tasks using rapid, data-driven path planning, while the slow system focuses on complex reasoning and decision-making in challenging or unfamiliar situations. A dynamic switching mechanism based on score distribution and feedback allows seamless transitions between the two systems. Visual prompts generated by the fast system enable human-like reasoning in the slow system, which provides high-quality feedback to enhance the fast system’s decision-making. To evaluate FASIONAD, we introduce a new benchmark derived from the nuScenes dataset, specifically designed to differentiate fast and slow scenarios. FASIONAD achieves state-of-the-art performance on this benchmark, establishing a new standard for frameworks integrating fast and slow cognitive processes in autonomous driving. This approach paves the way for more adaptive, human-like autonomous driving systems.
arxiv情報
著者 | Kangan Qian,Zhikun Ma,Yangfan He,Ziang Luo,Tianyu Shi,Tianze Zhu,Jiayin Li,Jianhui Wang,Ziyu Chen,Xiao He,Yining Shi,Zheng Fu,Xinyu Jiao,Kun Jiang,Diange Yang,Takafumi Matsumaru |
発行日 | 2024-11-27 03:14:16+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google