A Conflicts-free, Speed-lossless KAN-based Reinforcement Learning Decision System for Interactive Driving in Roundabouts

要約

ロータリーでの自動運転、特に自動運転車 (AV) と人間が運転する車両が共存する混合交通の状況では、安全性と効率性が非常に重要です。
この論文では、ラウンドアバウトのさまざまなレベルの交通の流れにわたって安全で効率的な運転行動を促進するように調整された学習ベースのアルゴリズムを紹介します。
提案されたアルゴリズムは、ディープ Q ラーニング ネットワークを採用して、複雑な複数車両のラウンドアバウトでの安全で効率的な運転戦略を効果的に学習します。
さらに、KAN (コルモゴロフ-アーノルド ネットワーク) により、AV が周囲の状況を確実かつ正確に学習する能力が強化されます。
AV が環境と相互作用する際の衝突を回避するために危険な行動を置き換えるためにアクション インスペクターが統合されており、AV の運転効率と安全性を高めるためにルート プランナーが提案されています。
さらに、モデル予測制御を採用し、運転動作の安定性と正確性を確保しています。
結果は、報酬関数のスムーズな収束とさまざまな交通流にわたるトレーニング曲線の分散の低さによって証明されるように、私たちが提案したシステムが、安定したトレーニングプロセスを維持しながら、安全で効率的な運転を一貫して達成していることを示しています。
最先端のベンチマークと比較して、提案されたアルゴリズムは衝突の数を減らし、目的地までの移動時間を短縮します。

要約(オリジナル)

Safety and efficiency are crucial for autonomous driving in roundabouts, especially in the context of mixed traffic where autonomous vehicles (AVs) and human-driven vehicles coexist. This paper introduces a learning-based algorithm tailored to foster safe and efficient driving behaviors across varying levels of traffic flows in roundabouts. The proposed algorithm employs a deep Q-learning network to effectively learn safe and efficient driving strategies in complex multi-vehicle roundabouts. Additionally, a KAN (Kolmogorov-Arnold network) enhances the AVs’ ability to learn their surroundings robustly and precisely. An action inspector is integrated to replace dangerous actions to avoid collisions when the AV interacts with the environment, and a route planner is proposed to enhance the driving efficiency and safety of the AVs. Moreover, a model predictive control is adopted to ensure stability and precision of the driving actions. The results show that our proposed system consistently achieves safe and efficient driving whilst maintaining a stable training process, as evidenced by the smooth convergence of the reward function and the low variance in the training curves across various traffic flows. Compared to state-of-the-art benchmarks, the proposed algorithm achieves a lower number of collisions and reduced travel time to destination.

arxiv情報

著者 Zhihao Lin,Zhen Tian,Qi Zhang,Ziyang Ye,Hanyang Zhuang,Jianglin Lan
発行日 2024-08-15 16:10:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO, cs.SY, eess.SY パーマリンク