Training Adversarial yet Safe Agent to Characterize Safety Performance of Highly Automated Vehicles

要約

本稿では、ブラックボックス型高度自動運転車(HAV)の安全性能試験と特性評価に焦点を当てる。既存のテストアプローチは、一般的にHAVを特定のテスト環境に配備することでテスト結果を得る。このようなテスト環境には、(i)人間のドライバーから学んだ自然な運転方針、(ii)実走行データから抽出した具体的シナリオ、(iii)安全上重要な事象の強制に焦点を当てたモデルベースまたはデータ駆動型の敵対的テスト手法など、他の交通参加者から提示された様々な受動的テスト戦略が含まれる。HAVの安全性能はさらに、得られたテスト結果を、観察された衝突リスクのような特定の選択された指標で分析することによって特徴付けられる。前述のテスト手法は、セーフティクリティカルな事象の少なさ、限定された運用設計領域(ODD)カバレッジ、あるいはロングテールの安全でないケースに偏っていることに悩まされている。本稿では、これらの既存の手法とは異なる、新規かつ有益なテスト戦略を提案する。この提案は、比較的安全なHAVの運転方針は、ある一定レベルの全体的な安全結果を達成するために、交通車両がより高い攻撃性を示すことを可能にするという直感に触発されたものである。このようなHAVと交通の対話戦略を具体的に特徴付け、HAVの安全性能指標として利用することができる。提案するテストスキームのもとでは、HAVはその完全なODDのもとで、セーフティクリティカルな事象を発生させる際の安全性と逆行性のトレードオフを表す報酬関数で評価される。提案手法は、異なる運用設計領域における様々なHAV設計を用いてシミュレーションで実証される。

要約(オリジナル)

This paper focuses on safety performance testing and characterization of black-box highly automated vehicles (HAV). Existing testing approaches typically obtain the testing outcomes by deploying the HAV into a specific testing environment. Such a testing environment can involve various passively given testing strategies presented by other traffic participants such as (i) the naturalistic driving policy learned from human drivers, (ii) extracted concrete scenarios from real-world driving data, and (iii) model-based or data-driven adversarial testing methodologies focusing on forcing safety-critical events. The safety performance of HAV is further characterized by analyzing the obtained testing outcomes with a particular selected measure, such as the observed collision risk. The aforementioned testing practices suffer from the scarcity of safety-critical events, have limited operational design domain (ODD) coverage, or are biased toward long-tail unsafe cases. This paper presents a novel and informative testing strategy that differs from these existing practices. The proposal is inspired by the intuition that a relatively safer HAV driving policy would allow the traffic vehicles to exhibit a higher level of aggressiveness to achieve a certain fixed level of an overall safe outcome. One can specifically characterize such a HAV and traffic interactive strategy and use it as a safety performance indicator for the HAV. Under the proposed testing scheme, the HAV is evaluated under its full ODD with a reward function that represents a trade-off between safety and adversity in generating safety-critical events. The proposed methodology is demonstrated in simulation with various HAV designs under different operational design domains.

arxiv情報

著者 Minghao Zhu,Anmol Sidhu,Keith A. Redmill
発行日 2024-02-02 17:16:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO パーマリンク