Residual Policy Learning for Vehicle Control of Autonomous Racing Cars

要約

レーシングカーは物理的な運転限界で動作するため、自動レース用の車両コントローラーの開発は困難です。
パフォーマンス向上への需要に促されて、自動レースの研究では、機械学習ベースのコントローラーの普及が見られました。
これらのアプローチは競争力のあるパフォーマンスを示しますが、実際の適用性は制限されることがよくあります。
残差ポリシー学習は、古典的なコントローラーと学習された残差コントローラーを組み合わせることで、この欠点を軽減することを約束します。
残差コントローラーの重要な利点は、古典的なコントローラーの安定した動作と同様の高い適応性です。
我々は、レーシングラインの経路追従のための古典的なコントローラーを修正することを学習する自律型レーシングカー用の残留車両コントローラーを提案します。
広範な研究では、F1TENTH 自律走行レーシング シリーズのシミュレートされた車について、私たちのアプローチによるパフォーマンスの向上が評価されました。
再現された 12 の現実世界のレーストラックの評価では、残留コントローラーが従来のコントローラーと比較してラップタイムを平均 4.55 % 短縮し、未知のレーストラックでラップタイムを向上させることもできることが示されています。

要約(オリジナル)

The development of vehicle controllers for autonomous racing is challenging because racing cars operate at their physical driving limit. Prompted by the demand for improved performance, autonomous racing research has seen the proliferation of machine learning-based controllers. While these approaches show competitive performance, their practical applicability is often limited. Residual policy learning promises to mitigate this drawback by combining classical controllers with learned residual controllers. The critical advantage of residual controllers is their high adaptability parallel to the classical controller’s stable behavior. We propose a residual vehicle controller for autonomous racing cars that learns to amend a classical controller for the path-following of racing lines. In an extensive study, performance gains of our approach are evaluated for a simulated car of the F1TENTH autonomous racing series. The evaluation for twelve replicated real-world racetracks shows that the residual controller reduces lap times by an average of 4.55 % compared to a classical controller and even enables lap time gains on unknown racetracks.

arxiv情報

著者 Raphael Trumpp,Denis Hoornaert,Marco Caccamo
発行日 2023-05-31 09:34:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY パーマリンク