A Distributionally Robust Approach to Regret Optimal Control using the Wasserstein Distance

要約

本論文は、状態過程における確率的加法的外乱の影響を受ける二次コストを伴う離散時間線形動的システムの最適制御を後悔するための、分布的にロバストなアプローチを提案する。
撹乱過程の根底にある確率分布は不明ですが、タイプ 2 のワッサーシュタイン距離で定義された所定の分布球内にあると想定されています。
このフレームワークでは、厳密に因果的な線形外乱フィードバック コントローラーが、最悪の場合に予想されるリグアロングを最小限に抑えるように設計されています。
コントローラが被る後悔は、外乱プロセスの実現に応じてコントローラが被るコストと、最初から外乱プロセスの実現を完全に知っている最適な非因果的コントローラが被るコストとの差として定義される。
最適輸送問題の十分に確立された双対性理論に基づいて、ミニマックスリグレス最適制御問題の再定式化を扱いやすい半正定プログラムとして導出します。
同等の双対再定式化を使用して、ワッサースタイン ボールの中心の分布に関連して、最悪の場合の予想されるリアクションを達成する最悪の場合の分布を特徴付けます。
例示的な例と数値実験を使用して、ミニマックス リガート最適制御設計法と分布的にロバストな最適制御アプローチを比較します。

要約(オリジナル)

This paper proposes a distributionally robust approach to regret optimal control of discrete-time linear dynamical systems with quadratic costs subject to a stochastic additive disturbance on the state process. The underlying probability distribution of the disturbance process is unknown, but assumed to lie in a given ball of distributions defined in terms of the type-2 Wasserstein distance. In this framework, strictly causal linear disturbance feedback controllers are designed to minimize the worst-case expected regret. The regret incurred by a controller is defined as the difference between the cost it incurs in response to a realization of the disturbance process and the cost incurred by the optimal noncausal controller which has perfect knowledge of the disturbance process realization at the outset. Building on a well-established duality theory for optimal transport problems, we derive a reformulation of the minimax regret optimal control problem as a tractable semidefinite program. Using the equivalent dual reformulation, we characterize a worst-case distribution achieving the worst-case expected regret in relation to the distribution at the center of the Wasserstein ball. We compare the minimax regret optimal control design method with the distributionally robust optimal control approach using an illustrative example and numerical experiments.

arxiv情報

著者 Feras Al Taha,Shuhao Yan,Eilyan Bitar
発行日 2023-08-16 15:38:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.SY, eess.SY, math.OC パーマリンク