要約
自律走行車の進路計画は、安全性と規制遵守が極めて重要な段階に達している。本稿では、潜在的な交通ルール違反を予測するために、運動プランナーと深層強化学習モデルを統合するアプローチを提示する。我々の主な革新点は、アクター批判手法における標準的なアクターネットワークを、安定かつ解釈可能な軌道生成を保証する運動計画モジュールに置き換えたことである。このセットアップでは、強化学習エージェントの批評家を訓練するための報酬として交通ルールの頑健性を使用し、批評家の出力は、軌道の選択を導く運動プランナのコスト関数として直接使用される。我々は、ドイツの道路交通規則からいくつかの主要な州間規則をルールブックに組み込み、複雑な交通情報を扱うためにグラフベースの状態表現を用いる。ドイツのオープンな高速道路データセットを用いた実験により、このモデルが計画地平線を越えて交通規則違反を予測し、防止できることが示され、困難な交通シナリオにおける安全性と規則遵守が向上する。
要約(オリジナル)
Autonomous vehicle path planning has reached a stage where safety and regulatory compliance are crucial. This paper presents an approach that integrates a motion planner with a deep reinforcement learning model to predict potential traffic rule violations. Our main innovation is replacing the standard actor network in an actor-critic method with a motion planning module, which ensures both stable and interpretable trajectory generation. In this setup, we use traffic rule robustness as the reward to train a reinforcement learning agent’s critic, and the output of the critic is directly used as the cost function of the motion planner, which guides the choices of the trajectory. We incorporate some key interstate rules from the German Road Traffic Regulation into a rule book and use a graph-based state representation to handle complex traffic information. Experiments on an open German highway dataset show that the model can predict and prevent traffic rule violations beyond the planning horizon, increasing safety and rule compliance in challenging traffic scenarios.
arxiv情報
著者 | Yanliang Huang,Sebastian Mair,Zhuoqi Zeng,Matthias Althoff |
発行日 | 2025-04-04 14:28:47+00:00 |
arxivサイト | arxiv_id(pdf) |