Building reliable sim driving agents by scaling self-play

要約

シミュレーションエージェントは、自律車両(AVS)などの人間と相互作用するシステムを設計およびテストするために不可欠です。
これらのエージェントは、AVパフォーマンスのベンチマークからシステムの制限へのストレステストまで、さまざまな目的を果たしますが、すべてのユースケースは重要な要件である信頼性を共有しています。
シミュレーションエージェントは、デザイナーが意図したとおりに動作し、分析の信号対雑音比を損なう可能性のある衝突のような意図しないアクションを最小限に抑える必要があります。
信頼性の高いSIMエージェントの基盤として、人間の知覚と制御に関する半現実的な制限の下で、WAYMOオープンモーションデータセットの数千のシナリオにスケーリング自己プレイを提案します。
単一のGPUでのゼロからのトレーニング、当社のエージェントは1日以内に完全なトレーニングセットをほぼ解決します。
彼らは、目に見えないテストシーンに効果的に一般化し、10,000の保有シナリオで0.8%未満の衝突およびオフロード事件で99.8%の目標完了率を達成します。
分配内の一般化を超えて、私たちのエージェントは分散型シーンに対する部分的な堅牢性を示し、そのような場合にほぼ完璧なパフォーマンスに達するために数分で微調整できます。
エージェントの行動のデモンストレーションは、このリンクで見つけることができます。
事前に訓練されたエージェントと完全なコードベースの両方をオープンソースします。
エージェントの動作のデモンストレーションは、\ url {https://sites.google.com/view/reliable-sim-agents}で見つけることができます。

要約(オリジナル)

Simulation agents are essential for designing and testing systems that interact with humans, such as autonomous vehicles (AVs). These agents serve various purposes, from benchmarking AV performance to stress-testing the system’s limits, but all use cases share a key requirement: reliability. A simulation agent should behave as intended by the designer, minimizing unintended actions like collisions that can compromise the signal-to-noise ratio of analyses. As a foundation for reliable sim agents, we propose scaling self-play to thousands of scenarios on the Waymo Open Motion Dataset under semi-realistic limits on human perception and control. Training from scratch on a single GPU, our agents nearly solve the full training set within a day. They generalize effectively to unseen test scenes, achieving a 99.8% goal completion rate with less than 0.8% combined collision and off-road incidents across 10,000 held-out scenarios. Beyond in-distribution generalization, our agents show partial robustness to out-of-distribution scenes and can be fine-tuned in minutes to reach near-perfect performance in those cases. Demonstrations of agent behaviors can be found at this link. We open-source both the pre-trained agents and the complete code base. Demonstrations of agent behaviors can be found at \url{https://sites.google.com/view/reliable-sim-agents}.

arxiv情報

著者 Daphne Cornelisse,Aarav Pandya,Kevin Joseph,Joseph Suárez,Eugene Vinitsky
発行日 2025-02-20 16:30:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク