Adaptive Kalman-based hybrid car following strategy using TD3 and CACC


上記の問題に対処するために、適応カルマンフィルタに基づくハイブリッド車追従戦略が、CACCおよびTwin Delayed Deep Deterministic Policy Gradient(TD3)アルゴリズムを考慮して提案される。
固定係数に基づく従来のハイブリッド戦略とは異なり、カルマン ゲイン H は、適応係数として使用され、マルチタイムステップ予測とモンテカルロ ツリー検索から導出されます。
研究の終了時点で、4157745 タイムステップのシミュレーション結果は、TD3 および HCFS アルゴリズムと比較して、この研究で提案されたアルゴリズムが、快適性と効率を損なうことなく、混合交通流における後続車の安全性を大幅に強化できることを示しています。


In autonomous driving, the hybrid strategy of deep reinforcement learning and cooperative adaptive cruise control (CACC) can fully utilize the advantages of the two algorithms and significantly improve the performance of car following. However, it is challenging for the traditional hybrid strategy based on fixed coefficients to adapt to mixed traffic flow scenarios, which may decrease the performance and even lead to accidents. To address the above problems, a hybrid car following strategy based on an adaptive Kalman Filter is proposed by regarding CACC and Twin Delayed Deep Deterministic Policy Gradient (TD3) algorithms. Different from traditional hybrid strategy based on fixed coefficients, the Kalman gain H, using as an adaptive coefficient, is derived from multi-timestep predictions and Monte Carlo Tree Search. At the end of study, simulation results with 4157745 timesteps indicate that, compared with the TD3 and HCFS algorithms, the proposed algorithm in this study can substantially enhance the safety of car following in mixed traffic flow without compromising the comfort and efficiency.


著者 Yuqi Zheng,Ruidong Yan,Bin Jia,Rui Jiang,Adriana TAPUS,Xiaojing Chen,Shiteng Zheng,Ying Shang
発行日 2023-12-26 10:51:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.RO, cs.SY, eess.SY パーマリンク