要約
学習ベースのモデル予測制御は、データ駆動型の方法で車両の閉ループ挙動を改善するために、自動レースに広く適用されています。
雨などにより環境条件が変化した場合、多くの場合、予測モデルのみが適応されますが、コントローラーのパラメーターは一定に保たれます。
ただし、これは最適ではない動作につながる可能性があります。
この論文では、モデルと目的の両方を同時に適応させて、データ効率の高いコントローラーの調整の問題に取り組みます。
提案されたアプローチの主な新規性は、学習された力学モデルを活用して、環境条件をいわゆるコンテキストとしてエンコードすることです。
この洞察により、状況に応じたベイジアン最適化を採用して、さまざまな環境条件にわたって知識を効率的に伝達できるようになります。
その結果、各コンテキストに最適なコントローラー構成を見つけるために必要なデータが少なくなります。
提案されたフレームワークは、1:28 スケールの RC レースカーを備えた実験プラットフォームで 3,000 周以上走行して広範囲に評価されました。
結果は、私たちのアプローチが、標準的なベイジアン最適化に基づく他のアプローチと比較して、より少ないデータしか必要とせずに、さまざまなコンテキストにわたってラップタイムを最適化することに成功していることを示しています。
要約(オリジナル)
Learning-based model predictive control has been widely applied in autonomous racing to improve the closed-loop behaviour of vehicles in a data-driven manner. When environmental conditions change, e.g., due to rain, often only the predictive model is adapted, but the controller parameters are kept constant. However, this can lead to suboptimal behaviour. In this paper, we address the problem of data-efficient controller tuning, adapting both the model and objective simultaneously. The key novelty of the proposed approach is that we leverage a learned dynamics model to encode the environmental condition as a so-called context. This insight allows us to employ contextual Bayesian optimization to efficiently transfer knowledge across different environmental conditions. Consequently, we require fewer data to find the optimal controller configuration for each context. The proposed framework is extensively evaluated with more than 3’000 laps driven on an experimental platform with 1:28 scale RC race cars. The results show that our approach successfully optimizes the lap time across different contexts requiring fewer data compared to other approaches based on standard Bayesian optimization.
arxiv情報
著者 | Lukas P. Fröhlich,Christian Küttel,Elena Arcari,Lukas Hewing,Melanie N. Zeilinger,Andrea Carron |
発行日 | 2024-08-22 15:55:11+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google