A Nested Graph Reinforcement Learning-based Decision-making Strategy for Eco-platooning

要約

隊列走行技術は、正確な車両制御、交通流の最適化、エネルギー効率の向上で知られています。
しかし、大規模な混合隊列では、車両の異質性と予測不可能な交通状況が事実上のボトルネックにつながります。
これらのボトルネックにより、隊列内の交通スループットが低下し、エネルギー消費が増加します。
これらの課題に対処するために、入れ子になったグラフ強化学習に基づく意思決定戦略を導入します。
この戦略により、協調的な意思決定が向上し、エネルギー効率が確保され、渋滞が緩和されます。
我々は、非ユークリッド空間における車両と隊列間の動的な相互作用をマッピングする、ネストされた交通グラフ表現の理論を提案します。
時空間加重グラフをマルチヘッド アテンション メカニズムに組み込むことで、ローカル データとグローバル データの両方を処理するモデルの能力がさらに強化されます。
さらに、隊列走行の自己反復学習機能を強化するために、ネストされたグラフ強化学習フレームワークを開発しました。
I-24 データセットを使用して、比較アルゴリズム実験、一般化可能性テスト、および透過性アブレーション実験を設計および実施し、それによって提案された戦略の有効性を検証しました。
ベースラインと比較して、私たちの戦略ではスループットが 10% 増加し、エネルギー使用量が 9% 減少します。
具体的には、CAV の普及率を高めると、トラフィックのスループットが大幅に向上しますが、エネルギー消費も増加します。

要約(オリジナル)

Platooning technology is renowned for its precise vehicle control, traffic flow optimization, and energy efficiency enhancement. However, in large-scale mixed platoons, vehicle heterogeneity and unpredictable traffic conditions lead to virtual bottlenecks. These bottlenecks result in reduced traffic throughput and increased energy consumption within the platoon. To address these challenges, we introduce a decision-making strategy based on nested graph reinforcement learning. This strategy improves collaborative decision-making, ensuring energy efficiency and alleviating congestion. We propose a theory of nested traffic graph representation that maps dynamic interactions between vehicles and platoons in non-Euclidean spaces. By incorporating spatio-temporal weighted graph into a multi-head attention mechanism, we further enhance the model’s capacity to process both local and global data. Additionally, we have developed a nested graph reinforcement learning framework to enhance the self-iterative learning capabilities of platooning. Using the I-24 dataset, we designed and conducted comparative algorithm experiments, generalizability testing, and permeability ablation experiments, thereby validating the proposed strategy’s effectiveness. Compared to the baseline, our strategy increases throughput by 10% and decreases energy use by 9%. Specifically, increasing the penetration rate of CAVs significantly enhances traffic throughput, though it also increases energy consumption.

arxiv情報

著者 Xin Gao,Xueyuan Li,Hao Liu,Ao Li,Zhaoyang Ma,Zirui Li
発行日 2024-08-14 14:18:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.MA パーマリンク