要約
エンドツーエンドの自律運転は大幅に進歩しており、従来のパイプラインよりもオープンループ設定と閉ループ設定の両方でシステムのシンプルさやより強力な運転性能などの利点を提供します。
ただし、既存のフレームワークは、クローズドループ評価の成功率が低いことに依然として悩まされており、実際の展開における制限を強調しています。
このホワイトペーパーでは、X-Driverを紹介します。X-Driverは、閉ループの自律運転、考え方(COT)を活用して自己回復モデリングを活用して、知覚と意思決定を強化するために設計された統一されたマルチモーダル大手言語モデル(MLLMS)フレームワークを紹介します。
Bench2Driveを含むCarlaシミュレーション環境でのパブリックベンチマークを使用して、複数の自律運転タスクにわたってXドライバーを検証します[6]。
私たちの実験結果は、優れた閉ループの性能を示しており、現在の最先端(SOTA)を上回り、運転決定の解釈性を改善します。
これらの発見は、エンドツーエンドの運転における構造化された推論の重要性を強調し、Xドライバーを閉ループの自律運転の将来の研究の強力なベースラインとして確立します。
要約(オリジナル)
End-to-end autonomous driving has advanced significantly, offering benefits such as system simplicity and stronger driving performance in both open-loop and closed-loop settings than conventional pipelines. However, existing frameworks still suffer from low success rates in closed-loop evaluations, highlighting their limitations in real-world deployment. In this paper, we introduce X-Driver, a unified multi-modal large language models(MLLMs) framework designed for closed-loop autonomous driving, leveraging Chain-of-Thought(CoT) and autoregressive modeling to enhance perception and decision-making. We validate X-Driver across multiple autonomous driving tasks using public benchmarks in CARLA simulation environment, including Bench2Drive[6]. Our experimental results demonstrate superior closed-loop performance, surpassing the current state-of-the-art(SOTA) while improving the interpretability of driving decisions. These findings underscore the importance of structured reasoning in end-to-end driving and establish X-Driver as a strong baseline for future research in closed-loop autonomous driving.
arxiv情報
著者 | Wei Liu,Jiyuan Zhang,Binxiong Zheng,Yufeng Hu,Yingzhan Lin,Zengfeng Zeng |
発行日 | 2025-05-08 09:52:55+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google