要約
シミュレーションベースのテストは、自律車両(AVS)を検証および検証するための不可欠なツールとして浮上しています。
ただし、決定論的や模倣学習ベースのドライバーモデルなどの現代の方法論は、人間のような運転行動の変動性を捉えるのに苦労しています。
これらの課題を考慮して、私たちは、多様な人間のような運転行動をシミュレートする現実的なトラフィックシナリオ生成の一般的なフレームワークであるHas-Genを提案します。
フレームワークは、最初に、車両の軌道データを安全機能に応じてさまざまな運転スタイルに刻みます。
次に、各クラスターの最大エントロピー逆補強学習を使用して、各運転スタイルに対応する報酬機能を学習します。
これらの報酬機能を使用して、この方法は、オフラインの強化学習前およびマルチエージェントの強化学習アルゴリズムを統合して、一般的で堅牢な運転ポリシーを取得します。
マルチパーセンティックシミュレーション結果は、提案されたシナリオ生成フレームワークが、強力な一般化能力を備えた多様で人間のような運転行動をシミュレートできることを示しています。
提案されたフレームワークは、90.96%の目標到達率、2.08%のオフロードレート、一般化テストで6.91%の衝突率を達成し、目標到達パフォーマンスで以前のアプローチを20%以上上回っています。
ソースコードはhttps://github.com/robosafe-lab/sim4adでリリースされます。
要約(オリジナル)
Simulation-based testing has emerged as an essential tool for verifying and validating autonomous vehicles (AVs). However, contemporary methodologies, such as deterministic and imitation learning-based driver models, struggle to capture the variability of human-like driving behavior. Given these challenges, we propose HAD-Gen, a general framework for realistic traffic scenario generation that simulates diverse human-like driving behaviors. The framework first clusters the vehicle trajectory data into different driving styles according to safety features. It then employs maximum entropy inverse reinforcement learning on each of the clusters to learn the reward function corresponding to each driving style. Using these reward functions, the method integrates offline reinforcement learning pre-training and multi-agent reinforcement learning algorithms to obtain general and robust driving policies. Multi-perspective simulation results show that our proposed scenario generation framework can simulate diverse, human-like driving behaviors with strong generalization capability. The proposed framework achieves a 90.96% goal-reaching rate, an off-road rate of 2.08%, and a collision rate of 6.91% in the generalization test, outperforming prior approaches by over 20% in goal-reaching performance. The source code is released at https://github.com/RoboSafe-Lab/Sim4AD.
arxiv情報
著者 | Cheng Wang,Lingxin Kong,Massimiliano Tamborski,Stefano V. Albrecht |
発行日 | 2025-03-19 09:38:45+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google