Data-Driven Distributionally Robust Optimal Control with State-Dependent Noise

要約

分布的にロバストな最適制御 (DROC) は、真の分布が不明な場合に確率的設定でロバストな制御を可能にする手法です。
従来の DROC アプローチでは、分布の不確実性を表す所定の曖昧性セットまたは KL 発散限界が必要です。
これらは先験的に知られていない可能性があり、手作りが必要な場合があります。
この論文では、不確実性と KL 発散の限界を推定するためのデータ駆動型手法を導入することで、この仮定を覆します。
この手法を D3ROC と呼びます。
私たちのアプローチの有効性を評価するために、未知のノイズ分布を持つ車のようなロボットのナビゲーション問題を検討します。
この結果は、D3ROC が反復線形 2 次ガウス (iLQG) 制御を上回る堅牢で効率的な制御ポリシーを提供することを示しています。
この結果は、さまざまなノイズ分布を処理する際の、提案したアプローチの有効性も示しています。

要約(オリジナル)

Distributionally Robust Optimal Control (DROC) is a technique that enables robust control in a stochastic setting when the true distribution is not known. Traditional DROC approaches require given ambiguity sets or a KL divergence bound to represent the distributional uncertainty. These may not be known a priori and may require hand-crafting. In this paper, we lift this assumption by introducing a data-driven technique for estimating the uncertainty and a bound for the KL divergence. We call this technique D3ROC. To evaluate the effectiveness of our approach, we consider a navigation problem for a car-like robot with unknown noise distributions. The results demonstrate that D3ROC provides robust and efficient control policies that outperform the iterative Linear Quadratic Gaussian (iLQG) control. The results also show the effectiveness of our proposed approach in handling different noise distributions.

arxiv情報

著者 Rui Liu,Guangyao Shi,Pratap Tokekar
発行日 2023-08-01 14:56:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク