Enhancing Sample Efficiency and Uncertainty Compensation in Learning-based Model Predictive Control for Aerial Robots

要約

最近のデータの可用性と信頼性の向上により、ロボット システム用の学習ベースのモデル予測制御 (MPC) フレームワークの開発が急増しています。
これらのフレームワークの多くは、非学習型フレームワークと比較して大幅なパフォーマンスの向上を達成しているにもかかわらず、ダイナミクス モデルを合成するためにオフライン学習手順に依存しています。
これは、ロボットが展開中に遭遇する不確実性が学習プロセスでは考慮されていないことを意味します。
一方、オンラインでダイナミクス モデルを学習する学習ベースの MPC 手法は、計算コストが高く、多くの場合、大量のデータを必要とします。
これらの欠点を軽減するために、$\mathcal{L}_1$ 適応制御のコンポーネントを学習ベースの MPC に組み込む、新しい学習強化 MPC フレームワークを提案します。
この統合により、サンプル効率の高い方法で一致した不確実性と一致しない不確かさの両方を正確に補償できるようになり、導入時の制御パフォーマンスが向上します。
私たちが提案するフレームワークでは、2 つの変形を提示し、それらをクアッドローター システムの制御に適用します。
シミュレーションと物理実験を通じて、提案したフレームワークが正確なダイナミクスモデルをオンザフライで合成できるだけでなく、広範囲の時空間的不確実性の下で閉ループ制御のパフォーマンスが大幅に向上することを実証します。

要約(オリジナル)

The recent increase in data availability and reliability has led to a surge in the development of learning-based model predictive control (MPC) frameworks for robot systems. Despite attaining substantial performance improvements over their non-learning counterparts, many of these frameworks rely on an offline learning procedure to synthesize a dynamics model. This implies that uncertainties encountered by the robot during deployment are not accounted for in the learning process. On the other hand, learning-based MPC methods that learn dynamics models online are computationally expensive and often require a significant amount of data. To alleviate these shortcomings, we propose a novel learning-enhanced MPC framework that incorporates components from $\mathcal{L}_1$ adaptive control into learning-based MPC. This integration enables the accurate compensation of both matched and unmatched uncertainties in a sample-efficient way, enhancing the control performance during deployment. In our proposed framework, we present two variants and apply them to the control of a quadrotor system. Through simulations and physical experiments, we demonstrate that the proposed framework not only allows the synthesis of an accurate dynamics model on-the-fly, but also significantly improves the closed-loop control performance under a wide range of spatio-temporal uncertainties.

arxiv情報

著者 Kong Yao Chee,Thales C. Silva,M. Ani Hsieh,George J. Pappas
発行日 2023-08-01 14:20:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY パーマリンク