RAMP-Net: A Robust Adaptive MPC for Quadrotors via Physics-informed Neural Network

要約

モデル予測制御 (MPC) は、厳密に制約された最適化問題を繰り返し解決する必要がある最先端の (SOTA) 制御手法です。
不確実なダイナミクスの場合、解析モデルに基づく堅牢な MPC は追加の制約を課し、問題の難易度を高めます。
パフォーマンスが重要なアプリケーションでは、より短い時間でより多くの計算が必要になるため、この問題は悪化します。
システムのダイナミクスを近似するために、ニューラル ネットワークなどのデータ駆動型の回帰手法が過去に提案されてきました。
ただし、そのようなモデルは、シンボリックな分析的事前分布がない場合、大量のラベル付きデータに依存しています。
これにより、重要なトレーニング オーバーヘッドが発生します。
物理学に基づいたニューラル ネットワーク (PINN) は、常微分方程式 (ODE) の非線形システムを妥当な精度で近似するための牽引力を得ています。
この作業では、部分的に単純な ODE と部分的にデータからトレーニングされたニューラル ネットワークを使用する、PINN (RAMP-Net) を介したロバスト アダプティブ MPC フレームワークを提案します。
物理損失は、理想的なダイナミクスを表す単純な ODE を学習するために使用されます。
損失関数内の分析関数にアクセスできることは、正則化機能として機能し、パラメトリックな不確実性に対して堅牢な動作を強制します。
一方、数学的モデリングでは考慮されない残留外乱 (ノンパラメトリック不確実性) に適応するために、通常のデータ損失が使用されます。
実験は、クワッドローターの軌道追跡のためにシミュレートされた環境で実行されます。
2 つの SOTA 回帰ベースの MPC メソッドと比較して、0.5 から 1.75 m/s の範囲の速度でトラッキング エラーが 7.8% から 43.2% および 8.04% から 61.5% 減少したことを報告しています。

要約(オリジナル)

Model Predictive Control (MPC) is a state-of-the-art (SOTA) control technique which requires solving hard constrained optimization problems iteratively. For uncertain dynamics, analytical model based robust MPC imposes additional constraints, increasing the hardness of the problem. The problem exacerbates in performance-critical applications, when more compute is required in lesser time. Data-driven regression methods such as Neural Networks have been proposed in the past to approximate system dynamics. However, such models rely on high volumes of labeled data, in the absence of symbolic analytical priors. This incurs non-trivial training overheads. Physics-informed Neural Networks (PINNs) have gained traction for approximating non-linear system of ordinary differential equations (ODEs), with reasonable accuracy. In this work, we propose a Robust Adaptive MPC framework via PINNs (RAMP-Net), which uses a neural network trained partly from simple ODEs and partly from data. A physics loss is used to learn simple ODEs representing ideal dynamics. Having access to analytical functions inside the loss function acts as a regularizer, enforcing robust behavior for parametric uncertainties. On the other hand, a regular data loss is used for adapting to residual disturbances (non-parametric uncertainties), unaccounted during mathematical modelling. Experiments are performed in a simulated environment for trajectory tracking of a quadrotor. We report 7.8% to 43.2% and 8.04% to 61.5% reduction in tracking errors for speeds ranging from 0.5 to 1.75 m/s compared to two SOTA regression based MPC methods.

arxiv情報

著者 Sourav Sanyal,Kaushik Roy
発行日 2023-02-24 17:54:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO, cs.SY, eess.SY パーマリンク