要約
実際にモデル予測制御(MPC)を使用する場合の一般的な問題は、予測の地平線を超えた安全仕様の満足度です。
理論的研究では、適切な端子セットの制約または十分に長い予測期間を実施することで安全性を保証できることが示されていますが、これらの手法は適用が困難であり、特に一般的な非線形ダイナミクスの場合には実務家が使用することはめったにありません。
この問題を解決するために、おおよその離散時間制御バリア関数を学習し、変異推論MPC(VIMPC)に組み込むことにより、「ブラックボックス」ダイナミクスへの正確な再帰的実現可能性、計算の軌道、および適用性の間にトレードオフを課します。
サンプリングベースのMPCパラダイム。
結果の状態の制約を処理するために、推定最適制御の分散を大幅に削減し、サンプル効率を改善し、CPUのリアルタイム計画を可能にする新しいサンプリング戦略をさらに提案します。
結果として得られるニューラルシールドVIMPC(NS-VIMPC)コントローラーは、既存のサンプリングベースのMPCコントローラーと比較して、既存のサンプリングベースのMPCコントローラーと比較して、大幅な安全性の向上をもたらします。
シミュレーションと現実世界のハードウェア実験の両方でアプローチを検証します。
要約(オリジナル)
A common problem when using model predictive control (MPC) in practice is the satisfaction of safety specifications beyond the prediction horizon. While theoretical works have shown that safety can be guaranteed by enforcing a suitable terminal set constraint or a sufficiently long prediction horizon, these techniques are difficult to apply and thus are rarely used by practitioners, especially in the case of general nonlinear dynamics. To solve this problem, we impose a tradeoff between exact recursive feasibility, computational tractability, and applicability to ”black-box” dynamics by learning an approximate discrete-time control barrier function and incorporating it into a variational inference MPC (VIMPC), a sampling-based MPC paradigm. To handle the resulting state constraints, we further propose a new sampling strategy that greatly reduces the variance of the estimated optimal control, improving the sample efficiency, and enabling real-time planning on a CPU. The resulting Neural Shield-VIMPC (NS-VIMPC) controller yields substantial safety improvements compared to existing sampling-based MPC controllers, even under badly designed cost functions. We validate our approach in both simulation and real-world hardware experiments.
arxiv情報
著者 | Ji Yin,Oswin So,Eric Yang Yu,Chuchu Fan,Panagiotis Tsiotras |
発行日 | 2025-02-20 19:59:11+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google