要約
高速コーナリング中にドリフト操作を実行することは、自動運転車にとって大きな課題ですが、旋回時間を最小限に抑え、運転ダイナミクスを向上させる可能性をもたらします。
強化学習 (RL) はシミュレートされた環境で有望な結果を示していますが、シミュレーションと現実世界の条件との間の不一致により、その実際の展開は制限されています。
この研究では、軌道の最適化とドリフト操作を統合する革新的な制御フレームワークを導入し、実車実装に対するアルゴリズムの適応性を向上させることを目的としています。
ベジェ ベースの事前軌道最適化を利用して報酬を強化し、シミュレートされた環境で Twin Delayed Deep Deterministic Policy Gradient (TD3) を通じてコントローラーを最適化しました。
実際の展開では、ハイブリッド RL-MPC 融合メカニズム を実装します。このメカニズムでは、TD3 由来の操作がモデル予測コントローラー (MPC) への主入力として機能します。
この統合により、最適な軌道の正確なリアルタイム追跡が可能になり、MPC はシミュレーションと現実の間のギャップを埋めるための修正入力を提供します。
この手法の有効性は、ドリフトUターンとドリフト直角ターンに焦点を当てた民生用電気自動車の実車試験によって検証されています。
これらの実車テストの制御結果は、補足的なビデオ証拠 (https://youtu.be/5wp67FcpfL8) によって裏付けられ、論文に徹底的に文書化されています。
注目すべき点は、この研究が RL ベースの過渡ドリフト コーナリング アルゴリズムを民生用電気自動車に展開して適用した最初の研究であるということです。
要約(オリジナル)
Executing drift maneuvers during high-speed cornering presents significant challenges for autonomous vehicles, yet offers the potential to minimize turning time and enhance driving dynamics. While reinforcement learning (RL) has shown promising results in simulated environments, discrepancies between simulations and real-world conditions have limited its practical deployment. This study introduces an innovative control framework that integrates trajectory optimization with drift maneuvers, aiming to improve the algorithm’s adaptability for real-vehicle implementation. We leveraged Bezier-based pre-trajectory optimization to enhance rewards and optimize the controller through Twin Delayed Deep Deterministic Policy Gradient (TD3) in a simulated environment. For real-world deployment, we implement a hybrid RL-MPC fusion mechanism, , where TD3-derived maneuvers serve as primary inputs for a Model Predictive Controller (MPC). This integration enables precise real-time tracking of the optimal trajectory, with MPC providing corrective inputs to bridge the gap between simulation and reality. The efficacy of this method is validated through real-vehicle tests on consumer-grade electric vehicles, focusing on drift U-turns and drift right-angle turns. The control outcomes of these real-vehicle tests are thoroughly documented in the paper, supported by supplementary video evidence (https://youtu.be/5wp67FcpfL8). Notably, this study is the first to deploy and apply an RL-based transient drift cornering algorithm on consumer-grade electric vehicles.
arxiv情報
著者 | Shiyue Zhao,Junzhi Zhang,Neda Masoud,Yuhong Jiang,Heye Huang,Tao Liu |
発行日 | 2024-11-18 17:40:43+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google