Differentially Flat Learning-based Model Predictive Control Using a Stability, State, and Input Constraining Safety Filter

要約

学習ベースの最適制御アルゴリズムは、過去の軌跡データと学習されたシステム ダイナミクス モデルを使用して未知のシステムを制御します。
これらのコントローラーは、学習したダイナミクスの線形近似、高速計算のためのパフォーマンスのトレーディング、または非線形最適化手法のいずれかを使用します。非線形最適化手法は、通常はパフォーマンスが向上しますが、リアルタイムの適用性が制限される可能性があります。
この研究では、微分平坦性を利用して最先端の学習ベースのコントローラーと同様のパフォーマンスを、大幅に少ない計算量で達成する新しい非線形コントローラーを紹介します。
微分平坦性は動的システムの特性であり、これにより非線形システムは非線形入力マッピングを通じて正確に線形化されます。
ここで、非線形変換はガウス プロセスとして学習され、安定性と入力およびフラット状態の制約を満たすことを高い確率で保証する安全フィルターで使用されます。
次に、この安全フィルターを使用してフラット モデル予測コントローラーからの入力を調整し、2 つの連続する凸最適化を通じて制約付き非線形学習ベースの最適制御を実行します。
私たちの方法を最先端の学習ベースの制御戦略と比較すると、同様のパフォーマンスが得られますが、計算効率が大幅に向上し、同時にフラット状態と入力の制約も尊重し、安定性を保証します。

要約(オリジナル)

Learning-based optimal control algorithms control unknown systems using past trajectory data and a learned model of the system dynamics. These controllers use either a linear approximation of the learned dynamics, trading performance for faster computation, or nonlinear optimization methods, which typically perform better but can limit real-time applicability. In this work, we present a novel nonlinear controller that exploits differential flatness to achieve similar performance to state-of-the-art learning-based controllers but with significantly less computational effort. Differential flatness is a property of dynamical systems whereby nonlinear systems can be exactly linearized through a nonlinear input mapping. Here, the nonlinear transformation is learned as a Gaussian process and is used in a safety filter that guarantees, with high probability, stability as well as input and flat state constraint satisfaction. This safety filter is then used to refine inputs from a flat model predictive controller to perform constrained nonlinear learning-based optimal control through two successive convex optimizations. We compare our method to state-of-the-art learning-based control strategies and achieve similar performance, but with significantly better computational efficiency, while also respecting flat state and input constraints, and guaranteeing stability.

arxiv情報

著者 Adam W. Hall,Melissa Greeff,Angela P. Schoellig
発行日 2023-07-20 02:42:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY パーマリンク