Faster Model Predictive Control via Self-Supervised Initialization Learning

要約

さまざまな方法論にわたるロボット制御タスクの最適化には、モデル予測制御 (MPC) が含まれます。
ただし、非凸かつ微分不可能なコスト関数や長期にわたる計画期間などのシステムの複雑さにより、多くの場合、計算時間が大幅に増加し、MPC の実世界への適用性が制限されます。
最適化を高速化するためのこれまでの研究には、凸問題の解決と領域を維持するための一般化に制限がありました。
この課題を克服するために、私たちは最適化プロセスの迅速化を目的とした新しいフレームワークを開発しました。
私たちのフレームワークでは、オフラインの自己教師あり学習と強化学習によるオンライン微調整を組み合わせて、制御パフォーマンスを向上させ、最適化時間を短縮します。
私たちは、斬新で挑戦的なフォーミュラ 1 トラックの走行タスクにおけるこの手法の有効性を実証し、困難なホールドアウト トラックでの最適化時間で 3.9\% 高いパフォーマンスと、追跡精度で 3.6\% 高いパフォーマンスを達成しました。

要約(オリジナル)

Optimization for robot control tasks, spanning various methodologies, includes Model Predictive Control (MPC). However, the complexity of the system, such as non-convex and non-differentiable cost functions and prolonged planning horizons often drastically increases the computation time, limiting MPC’s real-world applicability. Prior works in speeding up the optimization have limitations on solving convex problem and generalizing to hold out domains. To overcome this challenge, we develop a novel framework aiming at expediting optimization processes. In our framework, we combine offline self-supervised learning and online fine-tuning through reinforcement learning to improve the control performance and reduce optimization time. We demonstrate the effectiveness of our method on a novel, challenging Formula-1-track driving task, achieving 3.9\% higher performance in optimization time and 3.6\% higher performance in tracking accuracy on challenging holdout tracks.

arxiv情報

著者 Zhaoxin Li,Letian Chen,Rohan Paleja,Subramanya Nageshrao,Matthew Gombolay
発行日 2024-08-06 18:41:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク