Self-Improving Safety Performance of Reinforcement Learning Based Driving with Black-Box Verification Algorithms


この研究では、ブラックボックス検証手法を使用して、強化学習 (RL) ベースの自動運転 (AD) エージェントの安全性能を強化する自己改善型人工知能システムを提案します。
RL アルゴリズムは、近年 AD アプリケーションで普及してきました。
ただし、既存の RL アルゴリズムのパフォーマンスは、トレーニング シナリオの多様性に大きく依存します。
AD 障害シナリオを検出した後、以前は安全でなかったシナリオのパフォーマンスを向上させるために、転移学習を介して RL エージェントのトレーニングが再開始されます。
ソース コードは で公開されています。


In this work, we propose a self-improving artificial intelligence system to enhance the safety performance of reinforcement learning (RL)-based autonomous driving (AD) agents using black-box verification methods. RL algorithms have become popular in AD applications in recent years. However, the performance of existing RL algorithms heavily depends on the diversity of training scenarios. A lack of safety-critical scenarios during the training phase could result in poor generalization performance in real-world driving applications. We propose a novel framework in which the weaknesses of the training set are explored through black-box verification methods. After discovering AD failure scenarios, the RL agent’s training is re-initiated via transfer learning to improve the performance of previously unsafe scenarios. Simulation results demonstrate that our approach efficiently discovers safety failures of action decisions in RL-based adaptive cruise control (ACC) applications and significantly reduces the number of vehicle collisions through iterative applications of our method. The source code is publicly available at


著者 Resul Dagdanov,Halil Durmus,Nazim Kemal Ure
発行日 2023-07-09 16:42:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク