要約
自律運転システムの安全性を確保することは、特にまれであるが潜在的に壊滅的な安全性クリティカルなシナリオを処理する上で、重要な課題のままです。
既存の研究では、自動運転車(AV)テストの安全性が批判的なシナリオの生成を調査しましたが、これらのシナリオを効果的にポリシー学習に効果的に組み込んで安全性を高める作業は限られています。
さらに、AVの進化する行動パターンとパフォーマンスボトルネックに適応するトレーニングカリキュラムの開発は、ほとんど未踏のままです。
これらの課題に対処するために、自律駆動エージェントのパーソナライズされたカリキュラム学習を可能にするためにビジョン言語モデル(VLM)を活用する新しいフレームワークであるCurricuvlmを提案します。
私たちのアプローチは、VLMSのマルチモーダル理解機能をユニークに活用して、エージェントの動作を分析し、パフォーマンスの弱点を特定し、カリキュラム適応のためのテーラードトレーニングシナリオを動的に生成します。
物語の説明を使用した安全でない運転状況の包括的な分析を通じて、CurricuvlmはAVの能力を評価し、重要な行動パターンを特定するための詳細な推論を実行します。
このフレームワークは、これらの特定された制限をターゲットにしたカスタマイズされたトレーニングシナリオを統合し、効果的でパーソナライズされたカリキュラム学習を可能にします。
WAYMOオープンモーションデータセットでの広範な実験は、CurricUVLMが通常および安全性の高いシナリオの両方で最先端のベースラインよりも優れていることを示しており、ナビゲーションの成功、効率の促進、安全メトリックの点で優れたパフォーマンスを達成しています。
さらなる分析により、Curricuvlmは、さまざまなRLアルゴリズムと統合して自律運転システムを強化できる一般的なアプローチとして機能することが明らかになりました。
コードおよびデモビデオは、https://zihaosheng.github.io/curricuvlm/で入手できます。
要約(オリジナル)
Ensuring safety in autonomous driving systems remains a critical challenge, particularly in handling rare but potentially catastrophic safety-critical scenarios. While existing research has explored generating safety-critical scenarios for autonomous vehicle (AV) testing, there is limited work on effectively incorporating these scenarios into policy learning to enhance safety. Furthermore, developing training curricula that adapt to an AV’s evolving behavioral patterns and performance bottlenecks remains largely unexplored. To address these challenges, we propose CurricuVLM, a novel framework that leverages Vision-Language Models (VLMs) to enable personalized curriculum learning for autonomous driving agents. Our approach uniquely exploits VLMs’ multimodal understanding capabilities to analyze agent behavior, identify performance weaknesses, and dynamically generate tailored training scenarios for curriculum adaptation. Through comprehensive analysis of unsafe driving situations with narrative descriptions, CurricuVLM performs in-depth reasoning to evaluate the AV’s capabilities and identify critical behavioral patterns. The framework then synthesizes customized training scenarios targeting these identified limitations, enabling effective and personalized curriculum learning. Extensive experiments on the Waymo Open Motion Dataset show that CurricuVLM outperforms state-of-the-art baselines across both regular and safety-critical scenarios, achieving superior performance in terms of navigation success, driving efficiency, and safety metrics. Further analysis reveals that CurricuVLM serves as a general approach that can be integrated with various RL algorithms to enhance autonomous driving systems. The code and demo video are available at: https://zihaosheng.github.io/CurricuVLM/.
arxiv情報
著者 | Zihao Sheng,Zilin Huang,Yansong Qu,Yue Leng,Sruthi Bhavanam,Sikai Chen |
発行日 | 2025-02-21 00:42:40+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google