Quantitative Representation of Scenario Difficulty for Autonomous Driving Based on Adversarial Policy Search

要約

敵対的シナリオの生成は、さまざまな課題や複雑な交通状況を効率的にシミュレートできるため、自動運転テストにとって非常に重要です。
ただし、現在の既存の方法を制御して、さまざまな競合レベルのシナリオなど、目的のシナリオを生成することは困難です。
したがって、この論文では、シナリオの難易度を表現するためのデータ駆動型の定量的方法を提案します。
ルールベースの離散的なシナリオ難易度表現法と比較して、提案したアルゴリズムは連続的な難易度表現を実現できます。
具体的には、環境エージェントを導入し、メカニズム知識と組み合わせた強化学習手法を構築し、敵対的な行動をするエージェントを求める政策探索を行う。
トレーニングプロセスのさまざまな段階での環境エージェントのモデルパラメータを抽出してポリシーグループを構築し、その後、異なる敵対強度を持つエージェントを取得します。これは、シミュレーション環境を通じてさまざまな困難シナリオでのデータ生成を実現するために使用されます。
最後に,データ駆動型シナリオ難易度定量的表現モデルを構築し,これを使用して,さまざまな難易度の下で環境エージェントポリシーを出力した。
結果の分析により、提案されたアルゴリズムは、高度な識別を備えた合理的で解釈可能なシナリオを生成でき、専門的な論理ルール設計なしで定量化可能な難易度表現を提供できることが示されています。
ビデオのリンクは https://www.youtube.com/watch?v=GceGdqAm9Ys です。

要約(オリジナル)

Adversarial scenario generation is crucial for autonomous driving testing because it can efficiently simulate various challenge and complex traffic conditions. However, it is difficult to control current existing methods to generate desired scenarios, such as the ones with different conflict levels. Therefore, this paper proposes a data-driven quantitative method to represent scenario difficulty. Compared with rule-based discrete scenario difficulty representation method, the proposed algorithm can achieve continuous difficulty representation. Specifically, the environment agent is introduced, and a reinforcement learning method combined with mechanism knowledge is constructed for policy search to obtain an agent with adversarial behavior. The model parameters of the environment agent at different stages in the training process are extracted to construct a policy group, and then the agents with different adversarial intensity are obtained, which are used to realize data generation in different difficulty scenarios through the simulation environment. Finally, a data-driven scenario difficulty quantitative representation model is constructed, which is used to output the environment agent policy under different difficulties. The result analysis shows that the proposed algorithm can generate reasonable and interpretable scenarios with high discrimination, and can provide quantifiable difficulty representation without any expert logic rule design. The video link is https://www.youtube.com/watch?v=GceGdqAm9Ys.

arxiv情報

著者 Shuo Yang,Caojun Wang,Yuanjian Zhang,Yuming Yin,Yanjun Huang,Shengbo Eben Li,Hong Chen
発行日 2024-08-26 03:57:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク