A Gaussian Process Model for Opponent Prediction in Autonomous Racing

要約

1 対 1 のレースでは、相手のターゲット車両 (TV) のインタラクティブな動作の正確なモデルが、追い越しなどの厳密に制約された、しかし非常にやりがいのある操作を実行するために必要です。
ただし、そのような情報は通常、競争シナリオでは利用できないため、以前のレースのテレビのデータを考慮して、予測と不確実性モデルを構築することを提案します。
特に、ワ​​ンステップ ガウス プロセス (GP) モデルは、クローズド ループ インタラクション データでトレーニングされ、未知のポリシーによって駆動される TV の動作を学習します。
公称軌道と関連する不確実性の予測は、サンプリングベースのアプローチを介して展開され、自車のモデル予測制御 (MPC) ポリシーで使用され、車両に対する追い越し操作を試行する際の安全性とパフォーマンスをインテリジェントにトレードオフします。
テレビ。
シミュレーションレースでMPCポリシーを使用して閉ループでGPベースの予測子を示し、そのパフォーマンスを文献のいくつかの予測子と比較します。
モンテカルロ研究では、GP ベースの予測子が、最大 3 倍多くのレースで安全性を維持しながら、同様の勝率を達成することがわかりました。
最後に、約 2.8 m/s の速度で動作する 1/10 スケールのレースカー プラットフォームでの実験的研究で、予測と制御のフレームワークをリアルタイムで実証しました。
ベースライン MPC 予測子。
ハードウェア実験のビデオは、https://youtu.be/KMSs4ofDfIs にあります。

要約(オリジナル)

In head-to-head racing, an accurate model of interactive behavior of the opposing target vehicle (TV) is required to perform tightly constrained, but highly rewarding maneuvers such as overtaking. However, such information is not typically made available in competitive scenarios, we therefore propose to construct a prediction and uncertainty model given data of the TV from previous races. In particular, a one-step Gaussian process (GP) model is trained on closed-loop interaction data to learn the behavior of a TV driven by an unknown policy. Predictions of the nominal trajectory and associated uncertainty are rolled out via a sampling-based approach and are used in a model predictive control (MPC) policy for the ego vehicle in order to intelligently trade-off between safety and performance when attempting overtaking maneuvers against a TV. We demonstrate the GP-based predictor in closed loop with the MPC policy in simulation races and compare its performance against several predictors from literature. In a Monte Carlo study, we observe that the GP-based predictor achieves similar win rates while maintaining safety in up to 3x more races. We finally demonstrate the prediction and control framework in real-time in a experimental study on a 1/10th scale racecar platform operating at speeds of around 2.8 m/s, and show a significant level of improvement when using the GP-based predictor over a baseline MPC predictor. Videos of the hardware experiments can be found at https://youtu.be/KMSs4ofDfIs.

arxiv情報

著者 Edward L. Zhu,Finn Lukas Busch,Jake Johnson,Francesco Borrelli
発行日 2023-03-01 18:12:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY パーマリンク