要約
郊外の高速道路などのフリーフローロードネットワークは、通勤者の流入の増加と限られたインフラストラクチャのために、ますます交通渋滞を経験しています。
トラフィックシグナルやローカルヒューリスティックなどの従来の制御メカニズムは、これらの高速で信号のない環境で効果がないか、実行不可能です。
新しい物理的インフラストラクチャを必要とせずに、スループットを最適化し、渋滞を防ぐために車両速度を動的に変調する強化学習ベースのトラフィックコントロールプロトコルである自己規制車を導入します。
当社のアプローチは、古典的なトラフィックフロー理論、ギャップ受容モデル、および顕微鏡シミュレーションを物理学に基づいたRLフレームワークに統合します。
道路をスーパーセグメントに抽象化することにより、エージェントは緊急の流れのダイナミクスをキャプチャし、瞬時の交通観察から堅牢な速度変調ポリシーを学習します。
現実世界の高速道路ネットワーク上の高忠実度PTV VISSIMシミュレーターで評価されたこの方法は、合計スループットを5%改善し、平均遅延を13%減らし、非制御設定と比較して合計停止を3%減少させます。
また、さまざまなトラフィックパターンを一般化しながら、スムーズで抵抗に耐える流れを達成し、スケーラブルなML駆動型のトラフィック管理の可能性を示しています。
要約(オリジナル)
Free-flow road networks, such as suburban highways, are increasingly experiencing traffic congestion due to growing commuter inflow and limited infrastructure. Traditional control mechanisms, such as traffic signals or local heuristics, are ineffective or infeasible in these high-speed, signal-free environments. We introduce self-regulating cars, a reinforcement learning-based traffic control protocol that dynamically modulates vehicle speeds to optimize throughput and prevent congestion, without requiring new physical infrastructure. Our approach integrates classical traffic flow theory, gap acceptance models, and microscopic simulation into a physics-informed RL framework. By abstracting roads into super-segments, the agent captures emergent flow dynamics and learns robust speed modulation policies from instantaneous traffic observations. Evaluated in the high-fidelity PTV Vissim simulator on a real-world highway network, our method improves total throughput by 5%, reduces average delay by 13%, and decreases total stops by 3% compared to the no-control setting. It also achieves smoother, congestion-resistant flow while generalizing across varied traffic patterns, demonstrating its potential for scalable, ML-driven traffic management.
arxiv情報
著者 | Ankit Bhardwaj,Rohail Asim,Sachin Chauhan,Yasir Zaki,Lakshminarayanan Subramanian |
発行日 | 2025-06-13 17:31:23+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google