A Safe and Efficient Self-evolving Algorithm for Decision-making and Control of Autonomous Driving Systems

要約

自己進化能力を備えた自動運転車は、現実世界の環境における未知のシナリオに対処することが期待されています。
強化学習は、試行錯誤のメカニズムを利用して、最適なポリシーを学習することで自己進化することができ、意思決定の問題を解決するのに特に適しています。
ただし、強化学習には、特に連続アクション空間において、安全性の問題と低い学習効率の問題があります。
したがって、この文書の目的は、メカニズム、経験、学習のハイブリッド拡張アプローチを提案することで、上記の問題に対処することです。
具体的には、効率的な自己進化を実現するために、人間の運転経験との類似による運転傾向を提案して自動運転問題の探索空間を削減するとともに、機構モデルに基づく制約付き最適化問題を設計して自動運転中の安全性を確保する。
-進化するプロセス。
実験結果は、提案された方法がさまざまな複雑なシナリオにおいて安全で合理的​​な行動を生成でき、自動運転システムの性能を向上させることができることを示しています。
従来の強化学習と比較して、提案されたアルゴリズムの安全性と効率性は大幅に向上しています。
トレーニング プロセスには衝突がなく、トレーニング時間は現実世界の 10 分未満に相当します。

要約(オリジナル)

Autonomous vehicles with a self-evolving ability are expected to cope with unknown scenarios in the real-world environment. Take advantage of trial and error mechanism, reinforcement learning is able to self evolve by learning the optimal policy, and it is particularly well suitable for solving decision-making problems. However, reinforcement learning suffers from safety issues and low learning efficiency, especially in the continuous action space. Therefore, the motivation of this paper is to address the above problem by proposing a hybrid Mechanism-Experience-Learning augmented approach. Specifically, to realize the efficient self-evolution, the driving tendency by analogy with human driving experience is proposed to reduce the search space of the autonomous driving problem, while the constrained optimization problem based on a mechanistic model is designed to ensure safety during the self-evolving process. Experimental results show that the proposed method is capable of generating safe and reasonable actions in various complex scenarios, improving the performance of the autonomous driving system. Compared to conventional reinforcement learning, the safety and efficiency of the proposed algorithm are greatly improved. The training process is collision-free, and the training time is equivalent to less than 10 minutes in the real world.

arxiv情報

著者 Shuo Yang,Liwen Wang,Yanjun Huang,Hong Chen
発行日 2024-08-22 08:05:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク