Real-time Cooperative Vehicle Coordination at Unsignalized Road Intersections

要約

コネクテッドおよび自動化された車両の運転の安全性と交通量の向上を目的とした、信号のない交差点での協調的な調整は、近年ますます関心を集めています。
ただし、ほとんどの既存の調査は、計算の複雑さに悩まされているか、道路インフラストラクチャの可能性を最大限に活用することができません。
この目的のために、最初に専用の交差点調整フレームワークを提示します。このフレームワークでは、関与する車両が制御権限を引き渡し、中央コーディネーターからの指示に従います。
次に、協調システムの運転の安全性と長期的な安定性を確保しながら、トラフィックのスループットを最大化するために、統一された協調的な軌道最適化問題が定式化されます。
現実世界の展開における主要な計算上の課題に対処するために、この非凸の逐次決定問題をモデルフリーのマルコフ決定プロセス (MDP) に再定式化し、Twin Delayed Deep Deterministic Policy Gradient (TD3) ベースの
深層強化学習 (DRL) フレームワークの戦略。
シミュレーションと実際の実験は、提案された戦略が準静的な調整シナリオでほぼ最適なパフォーマンスを達成し、現実的な連続トラフィック フローでトラフィック スループットを大幅に改善できることを示しています。
最も顕著な利点は、私たちの戦略が計算の時間の複雑さをミリ秒に減らすことができ、道路の車線が増えるとスケーラブルであることが示されることです。

要約(オリジナル)

Cooperative coordination at unsignalized road intersections, which aims to improve the driving safety and traffic throughput for connected and automated vehicles, has attracted increasing interests in recent years. However, most existing investigations either suffer from computational complexity or cannot harness the full potential of the road infrastructure. To this end, we first present a dedicated intersection coordination framework, where the involved vehicles hand over their control authorities and follow instructions from a centralized coordinator. Then a unified cooperative trajectory optimization problem will be formulated to maximize the traffic throughput while ensuring the driving safety and long-term stability of the coordination system. To address the key computational challenges in the real-world deployment, we reformulate this non-convex sequential decision problem into a model-free Markov Decision Process (MDP) and tackle it by devising a Twin Delayed Deep Deterministic Policy Gradient (TD3)-based strategy in the deep reinforcement learning (DRL) framework. Simulation and practical experiments show that the proposed strategy could achieve near-optimal performance in sub-static coordination scenarios and significantly improve the traffic throughput in the realistic continuous traffic flow. The most remarkable advantage is that our strategy could reduce the time complexity of computation to milliseconds, and is shown scalable when the road lanes increase.

arxiv情報

著者 Jiping Luo,Tingting Zhang,Rui Hao,Donglin Li,Chunsheng Chen,Zhenyu Na,Qinyu Zhang
発行日 2023-03-22 06:38:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO, cs.SY, eess.SY パーマリンク