Risk-anticipatory autonomous driving strategies considering vehicles’ weights, based on hierarchical deep reinforcement learning

要約

自動運転車(AV)は、ドライバーのミスによって引き起こされる事故を防ぎ、道路交通のリスクを軽減する可能性があります。
衝突するとより重大な事故を引き起こす大型車両の性質上、自動運転における潜在的なリスクとその影響を軽減することを目的とした運転戦略を立てる際には、車両の重量を考慮する必要があります。
この研究では、周囲の車両の重量を考慮し、階層型深層強化学習を使用して、リスク予測に基づいた自動運転戦略を開発します。
リスクフィールド理論に基づいて、周囲の車両の重量を統合したリスク指標が提案され、自動運転の意思決定に組み込まれます。
ハイブリッド アクション スペースは、左車線変更、右車線変更、および車の追従を可能にするように設計されており、AV が可能な限り自由かつ現実的に動作できるようになります。
上記のハイブリッド意思決定問題を解決するために、アテンション メカニズム (AT-HPPO) を備えた階層的近接ポリシー最適化 (HPPO) アルゴリズムが開発され、高い堅牢性と一般化により安定したパフォーマンスを維持する上で大きな利点が得られます。
潜在的な事故の結果の観点から、開発されたAV運転戦略のパフォーマンスを評価するための指標である紛争潜在衝突エネルギー(PCEC)が新たに提案された。
シミュレーションとデータセットでの性能評価結果は、私たちのモデルが潜在的な事故の可能性と結果の両方を軽減し、同時に運転効率を維持する運転戦略を提供することを示しています。
開発された方法は、大型車両が交通量の大きな割合を占める高速道路を走行する AV にとって特に意味があります。

要約(オリジナル)

Autonomous vehicles (AVs) have the potential to prevent accidents caused by drivers errors and reduce road traffic risks. Due to the nature of heavy vehicles, whose collisions cause more serious crashes, the weights of vehicles need to be considered when making driving strategies aimed at reducing the potential risks and their consequences in the context of autonomous driving. This study develops an autonomous driving strategy based on risk anticipation, considering the weights of surrounding vehicles and using hierarchical deep reinforcement learning. A risk indicator integrating surrounding vehicles weights, based on the risk field theory, is proposed and incorporated into autonomous driving decisions. A hybrid action space is designed to allow for left lane changes, right lane changes and car-following, which enables AVs to act more freely and realistically whenever possible. To solve the above hybrid decision-making problem, a hierarchical proximal policy optimization (HPPO) algorithm with an attention mechanism (AT-HPPO) is developed, providing great advantages in maintaining stable performance with high robustness and generalization. An indicator, potential collision energy in conflicts (PCEC), is newly proposed to evaluate the performance of the developed AV driving strategy from the perspective of the consequences of potential accidents. The performance evaluation results in simulation and dataset demonstrate that our model provides driving strategies that reduce both the likelihood and consequences of potential accidents, at the same time maintaining driving efficiency. The developed method is especially meaningful for AVs driving on highways, where heavy vehicles make up a high proportion of the traffic.

arxiv情報

著者 Di Chen,Hao Li,Zhicheng Jin,Huizhao Tu,Meixin Zhu
発行日 2024-05-07 07:07:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク