Distributionally Robust Policy and Lyapunov-Certificate Learning


この記事では、モデルの不確実性の下で、分布的に堅牢な安定化ニューラル コントローラーと制御システムの証明書を合成するための新しい方法を紹介します。
この条件をニューラル ネットワーク ベースのコントローラーをトレーニングするための損失関数に統合し、結果として得られる閉ループ システムについて、その平衡状態の大域的漸近安定性が、分布外であっても高い信頼度で証明できることを示します (
OoD) モデルの不確実性。
提案された方法論の有効性と効率を実証するために、シミュレーションにおける 2 つの制御問題における不確実性を問わないベースライン アプローチおよびいくつかの強化学習アプローチと比較します。


This article presents novel methods for synthesizing distributionally robust stabilizing neural controllers and certificates for control systems under model uncertainty. A key challenge in designing controllers with stability guarantees for uncertain systems is the accurate determination of and adaptation to shifts in model parametric uncertainty during online deployment. We tackle this with a novel distributionally robust formulation of the Lyapunov derivative chance constraint ensuring a monotonic decrease of the Lyapunov certificate. To avoid the computational complexity involved in dealing with the space of probability measures, we identify a sufficient condition in the form of deterministic convex constraints that ensures the Lyapunov derivative constraint is satisfied. We integrate this condition into a loss function for training a neural network-based controller and show that, for the resulting closed-loop system, the global asymptotic stability of its equilibrium can be certified with high confidence, even with Out-of-Distribution (OoD) model uncertainties. To demonstrate the efficacy and efficiency of the proposed methodology, we compare it with an uncertainty-agnostic baseline approach and several reinforcement learning approaches in two control problems in simulation.


著者 Kehan Long,Jorge Cortes,Nikolay Atanasov
発行日 2024-08-03 18:43:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY, math.OC パーマリンク