CarDreamer: Open-Source Learning Platform for World Model based Autonomous Driving

要約

現実世界の複雑なシナリオを安全にナビゲートするには、自動運転車はさまざまな道路状況に適応し、将来の出来事を予測できなければなりません。
ワールド モデル (WM) ベースの強化学習 (RL) は、さまざまな環境の複雑なダイナミクスを学習および予測することにより、有望なアプローチとして浮上しています。
それにもかかわらず、私たちの知る限り、高度な運転環境でそのようなアルゴリズムをトレーニングおよびテストするためのアクセス可能なプラットフォームは存在しません。
この空白を埋めるために、WM ベースの自動運転アルゴリズムの開発専用に設計された初のオープンソース学習プラットフォームである CarDreamer を紹介します。
これは 3 つの主要なコンポーネントで構成されます。 1) ワールド モデル バックボーン: CarDreamer には、RL アルゴリズムの再現を簡素化するいくつかの最先端の WM が統合されています。
バックボーンは残りの部分から切り離されており、標準の Gym インターフェイスを使用して通信するため、ユーザーは独自のアルゴリズムを簡単に統合してテストできます。
2) 組み込みタスク: CarDreamer は、ジムのインターフェイスと互換性があり、経験的に最適化された報酬関数を備えた、高度に構成可能な運転タスクの包括的なセットを提供します。
3) タスク開発スイート: このスイートは運転タスクの作成を合理化し、交通の流れと車両ルートの簡単な定義を可能にし、マルチモーダル観測データの自動収集を可能にします。
視覚化サーバーを使用すると、ユーザーはブラウザを通じてエージェントの運転ビデオとパフォーマンス メトリクスをリアルタイムで追跡できます。
さらに、自動運転における WM の性能と可能性を評価するために、組み込みタスクを使用した広範な実験を実施します。
CarDreamer の豊富さと柔軟性のおかげで、私たちは観察モダリティ、可観測性、および車両の意図の共有が AV の安全性と効率に及ぼす影響を系統的に研究しています。
すべてのコードとドキュメントは https://github.com/ucd-dare/CarDreamer からアクセスできます。

要約(オリジナル)

To safely navigate intricate real-world scenarios, autonomous vehicles must be able to adapt to diverse road conditions and anticipate future events. World model (WM) based reinforcement learning (RL) has emerged as a promising approach by learning and predicting the complex dynamics of various environments. Nevertheless, to the best of our knowledge, there does not exist an accessible platform for training and testing such algorithms in sophisticated driving environments. To fill this void, we introduce CarDreamer, the first open-source learning platform designed specifically for developing WM based autonomous driving algorithms. It comprises three key components: 1) World model backbone: CarDreamer has integrated some state-of-the-art WMs, which simplifies the reproduction of RL algorithms. The backbone is decoupled from the rest and communicates using the standard Gym interface, so that users can easily integrate and test their own algorithms. 2) Built-in tasks: CarDreamer offers a comprehensive set of highly configurable driving tasks which are compatible with Gym interfaces and are equipped with empirically optimized reward functions. 3) Task development suite: This suite streamlines the creation of driving tasks, enabling easy definition of traffic flows and vehicle routes, along with automatic collection of multi-modal observation data. A visualization server allows users to trace real-time agent driving videos and performance metrics through a browser. Furthermore, we conduct extensive experiments using built-in tasks to evaluate the performance and potential of WMs in autonomous driving. Thanks to the richness and flexibility of CarDreamer, we also systematically study the impact of observation modality, observability, and sharing of vehicle intentions on AV safety and efficiency. All code and documents are accessible on https://github.com/ucd-dare/CarDreamer.

arxiv情報

著者 Dechen Gao,Shuangyu Cai,Hanchu Zhou,Hang Wang,Iman Soltani,Junshan Zhang
発行日 2024-05-15 05:57:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク