要約
この論文では、バリア証明書を使用して、未知のダイナミクスを持つ確率システムのデータから安全な戦略の最大セットを特定する方法を紹介します。
最初のステップは、ガウス過程 (GP) 回帰によってシステムのダイナミクスを学習し、この推定値の確率誤差を取得することです。
次に、学習した GP モデルを使用して、最大許容戦略セットを見つけるための区分的確率バリア関数を構築するためのアルゴリズムを開発します。これは、最大セットが特定されるまで最悪のコントロールを順次枝刈りすることに基づいています。
許容される戦略は、実際のシステムの確率的安全性を維持することが保証されています。
豊富な戦略空間により、安全性を保ちながら追加のデータ収集と複雑な動作が可能になるため、これは学習対応システムにとって特に重要です。
線形システムと非線形システムのケーススタディでは、システムを学習するためのデータセットのサイズを増やすと、許容される戦略セットが大きくなることが実証されています。
要約(オリジナル)
This paper introduces a method of identifying a maximal set of safe strategies from data for stochastic systems with unknown dynamics using barrier certificates. The first step is learning the dynamics of the system via Gaussian process (GP) regression and obtaining probabilistic errors for this estimate. Then, we develop an algorithm for constructing piecewise stochastic barrier functions to find a maximal permissible strategy set using the learned GP model, which is based on sequentially pruning the worst controls until a maximal set is identified. The permissible strategies are guaranteed to maintain probabilistic safety for the true system. This is especially important for learning-enabled systems, because a rich strategy space enables additional data collection and complex behaviors while remaining safe. Case studies on linear and nonlinear systems demonstrate that increasing the size of the dataset for learning the system grows the permissible strategy set.
arxiv情報
著者 | Rayan Mazouz,John Skovbekk,Frederik Baymler Mathiesen,Eric Frew,Luca Laurenti,Morteza Lahijanian |
発行日 | 2024-04-30 18:32:24+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google