Think2Drive: Efficient Reinforcement Learning by Thinking in Latent World Model for Quasi-Realistic Autonomous Driving (in CARLA-v2)

要約

現実世界の自動運転 (AD)、特に都市部での運転には、多くの特殊なケースが含まれます。
最近リリースされた AD シミュレーター CARLA v2 では、運転シーンに 39 の一般的なイベントが追加され、CARLA v1 と比較してより現実的なテストベッドが提供されます。
これはコミュニティに新たな課題をもたらしますが、既存の作品のほとんどが計画の特定のルールに依存する必要があるにもかかわらず、CARLA v2 のより複雑なケースをカバーできないため、これまでのところ、V2 の新しいシナリオでの成功を報告した文献はありません。
今回はプランナーを率先して直接育成し、コーナーケースにも柔軟かつ効果的に対応していきたいと考えており、それがADの未来でもあると考えています。
私たちの知る限り、私たちは Think2Drive for AD という名前の最初のモデルベースの RL メソッドを開発しました。ワールド モデルを使用して環境の遷移を学習し、プランナーをトレーニングするニューラル シミュレーターとして機能します。
このパラダイムは、ワールド モデルの低次元状態空間とテンソルの並列計算により、トレーニング効率を大幅に高めます。
その結果、Think2Drive は、単一の A6000 GPU でのトレーニングから 3 日以内に、CARLA v2 でエキスパート レベルの習熟度で実行できるようになりました。当社の知る限り、これまでのところ、成功 (100% のルート完了) の報告はありません。
カルラv2。
また、シナリオ別の走行モデルの評価を支援するベンチマーク「CornerCase-Repository」も提案します。
さらに、運転スコアから実際の運転パフォーマンスに関するより多くの情報が得られるように、ルート完了、違反数、シナリオ密度ごとにパフォーマンスを評価するための新しいバランスのとれた指標を提案します。

要約(オリジナル)

Real-world autonomous driving (AD) especially urban driving involves many corner cases. The lately released AD simulator CARLA v2 adds 39 common events in the driving scene, and provide more quasi-realistic testbed compared to CARLA v1. It poses new challenge to the community and so far no literature has reported any success on the new scenarios in V2 as existing works mostly have to rely on specific rules for planning yet they cannot cover the more complex cases in CARLA v2. In this work, we take the initiative of directly training a planner and the hope is to handle the corner cases flexibly and effectively, which we believe is also the future of AD. To our best knowledge, we develop the first model-based RL method named Think2Drive for AD, with a world model to learn the transitions of the environment, and then it acts as a neural simulator to train the planner. This paradigm significantly boosts the training efficiency due to the low dimensional state space and parallel computing of tensors in the world model. As a result, Think2Drive is able to run in an expert-level proficiency in CARLA v2 within 3 days of training on a single A6000 GPU, and to our best knowledge, so far there is no reported success (100\% route completion)on CARLA v2. We also propose CornerCase-Repository, a benchmark that supports the evaluation of driving models by scenarios. Additionally, we propose a new and balanced metric to evaluate the performance by route completion, infraction number, and scenario density, so that the driving score could give more information about the actual driving performance.

arxiv情報

著者 Qifeng Li,Xiaosong Jia,Shaobo Wang,Junchi Yan
発行日 2024-02-26 16:43:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク