Residual Policy Learning for Vehicle Control of Autonomous Racing Cars

要約

レーシングカーは物理的な走行限界で動作するため、自律型レース用の車両コントローラーの開発は困難です。
パフォーマンスの向上に対する需要に促されて、自律型レースの研究では、機械学習ベースのコントローラーが急増しています。
これらのアプローチは競争力のあるパフォーマンスを示しますが、実際の適用性はしばしば制限されます。
残差ポリシー学習は、従来のコントローラーと学習した残差コントローラーを組み合わせることで、これを軽減することを約束します。
残差コントローラーの重要な利点は、古典的なコントローラーの安定した動作に匹敵する高い適応性です。
レーシング ラインの経路追従のために古典的なコントローラーを修正することを学習する、自動レーシング カー用の残差車両コントローラーを提案します。
大規模な研究では、F1TENTH 自律型レーシング シリーズのシミュレートされた車に対して、私たちのアプローチのパフォーマンスの向上が評価されています。
再現された 12 の現実世界の競馬場の評価では、残留コントローラーが従来のコントローラーと比較してラップタイムを平均 4.55% 短縮し、ゼロショットが新しい競馬場に一般化されることが示されています。

要約(オリジナル)

The development of vehicle controllers for autonomous racing is challenging because racing cars operate at their physical driving limit. Prompted by the demand for improved performance, autonomous racing research has seen the proliferation of machine learning-based controllers. While these approaches show competitive performance, their practical applicability is often limited. Residual policy learning promises to mitigate this by combining classical controllers with learned residual controllers. The critical advantage of residual controllers is their high adaptability parallel to the classical controller’s stable behavior. We propose a residual vehicle controller for autonomous racing cars that learns to amend a classical controller for the path-following of racing lines. In an extensive study, performance gains of our approach are evaluated for a simulated car of the F1TENTH autonomous racing series. The evaluation for twelve replicated real-world racetracks shows that the residual controller reduces lap times by an average of 4.55 % compared to a classical controller and zero-shot generalizes to new racetracks.

arxiv情報

著者 Raphael Trumpp,Denis Hoornaert,Marco Caccamo
発行日 2023-02-14 13:33:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY パーマリンク