Self driving algorithm for an active four wheel drive racecar

要約

特に、独立したホイールトルク制御を提供するアクティブな四輪駆動(A4WD)システムを備えた電気自動車にとって、ハンドリング制限で自動運転車を制御することは重要な課題です。
従来の車両ダイナミクスコントロール(VDC)メソッドは複雑な物理ベースのモデルを使用しますが、この研究では、統一された高性能コントローラーを開発するために、深い強化学習(DRL)を調査します。
近位ポリシー最適化(PPO)アルゴリズムを使用して、タイヤグリップ制限でシミュレートされたレースカー(TORC)で最適なラップタイムのエージェントを訓練します。
重大なことに、エージェントは、速度、加速、ヨーレートなどの車両状態を、4つのホイールのそれぞれのステアリング角度コマンドと独立したトルクコマンドに直接マッピングするエンドツーエンドポリシーを学習します。
この定式化は、従来のペダル入力と明示的なトルクベクターアルゴリズムをバイパスし、エージェントがパフォーマンスと安定性を最大化するために必要なA4WD制御ロジックを暗黙的に学習できるようにします。
シミュレーション結果は、RLエージェントが洗練された戦略を学習し、ホイールトルクの分布をコーナーごとに動的に最適化して、ハンドリングを強化し、車両の固有のアンダーステア​​を軽減することを示しています。
学習した行動は、グリップ利用の側面で、競争力のあるラップタイムを達成しながら、従来の物理学ベースのA4WDコントローラーを潜在的に上回る可能性があります。
この研究では、DRLが複雑な車両ダイナミクスのための適応制御システムを作成する可能性を強調しています。RLは、RLが、レースと交通安全のために厳しいグリップ制限されたシナリオにおいて自律的な運転を進めるための強力な代替手段であることを示唆しています。

要約(オリジナル)

Controlling autonomous vehicles at their handling limits is a significant challenge, particularly for electric vehicles with active four wheel drive (A4WD) systems offering independent wheel torque control. While traditional Vehicle Dynamics Control (VDC) methods use complex physics-based models, this study explores Deep Reinforcement Learning (DRL) to develop a unified, high-performance controller. We employ the Proximal Policy Optimization (PPO) algorithm to train an agent for optimal lap times in a simulated racecar (TORCS) at the tire grip limit. Critically, the agent learns an end-to-end policy that directly maps vehicle states, like velocities, accelerations, and yaw rate, to a steering angle command and independent torque commands for each of the four wheels. This formulation bypasses conventional pedal inputs and explicit torque vectoring algorithms, allowing the agent to implicitly learn the A4WD control logic needed for maximizing performance and stability. Simulation results demonstrate the RL agent learns sophisticated strategies, dynamically optimizing wheel torque distribution corner-by-corner to enhance handling and mitigate the vehicle’s inherent understeer. The learned behaviors mimic and, in aspects of grip utilization, potentially surpass traditional physics-based A4WD controllers while achieving competitive lap times. This research underscores DRL’s potential to create adaptive control systems for complex vehicle dynamics, suggesting RL is a potent alternative for advancing autonomous driving in demanding, grip-limited scenarios for racing and road safety.

arxiv情報

著者 Gergely Bari,Laszlo Palkovics
発行日 2025-06-06 13:33:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク