Deep Reinforcement Learning to Maximize Arterial Usage during Extreme Congestion

要約

道路網での衝突、衝突、その他の事故は、軽減されないまま放置されると、システムの大部分に影響を与える連鎖的な障害を引き起こす可能性があります。
このような極度の渋滞シナリオにタイムリーに対処することは、排出量を削減し、生産性を高め、都市生活の質を向上させるために不可欠です。
この研究では、極度の渋滞時に複数車線の高速道路で交通渋滞を軽減するための深層強化学習 (DRL) アプローチを提案します。
エージェントは、高速道路の渋滞に対する適応的な迂回戦略を学習するようトレーニングされており、高速道路の車線と近隣の幹線ネットワークが最適に利用され、渋滞の軽減と交通速度の向上が得られます。
実験設定は、米国ワシントン州ショアラインにある全長 4 車線の高速道路で、2 つの出口と関連する幹線道路を、パラメータ化された交通を使用しながら、微細かつ連続的なマルチモーダル交通シミュレーター SUMO (都市モビリティのシミュレーション) でシミュレーションしました。
現実世界の交通データを使用して生成されたプロファイル。
私たちの分析によると、DRL ベースのコントローラーは、急な輻輳時に何もしない場合と比較して、平均トラフィック速度を 21\% 向上させることができます。
この研究ではさらに、報酬関数の選択に伴うトレードオフ、人間のコンプライアンスがエージェントのパフォーマンスに及ぼす影響、データの希薄性とスケーリングの問題に対処するためのエージェント間での知識伝達の実現可能性についても議論しています。

要約(オリジナル)

Collisions, crashes, and other incidents on road networks, if left unmitigated, can potentially cause cascading failures that can affect large parts of the system. Timely handling such extreme congestion scenarios is imperative to reduce emissions, enhance productivity, and improve the quality of urban living. In this work, we propose a Deep Reinforcement Learning (DRL) approach to reduce traffic congestion on multi-lane freeways during extreme congestion. The agent is trained to learn adaptive detouring strategies for congested freeway traffic such that the freeway lanes along with the local arterial network in proximity are utilized optimally, with rewards being congestion reduction and traffic speed improvement. The experimental setup is a 2.6-mile-long 4-lane freeway stretch in Shoreline, Washington, USA with two exits and associated arterial roads simulated on a microscopic and continuous multi-modal traffic simulator SUMO (Simulation of Urban MObility) while using parameterized traffic profiles generated using real-world traffic data. Our analysis indicates that DRL-based controllers can improve average traffic speed by 21\% when compared to no-action during steep congestion. The study further discusses the trade-offs involved in the choice of reward functions, the impact of human compliance on agent performance, and the feasibility of knowledge transfer from one agent to other to address data sparsity and scaling issues.

arxiv情報

著者 Ashutosh Dutta,Milan Jain,Arif Khan,Arun Sathanur
発行日 2023-05-16 16:53:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク