A Generalizable Physics-informed Learning Framework for Risk Probability Estimation

要約

長期的なリスク確率とその勾配の正確な推定は、多くの確率的安全制御手法にとって重要です。
ただし、目に見えない環境や変化する環境において、そのようなリスクの確率をリアルタイムで計算することは困難です。
モンテカルロ (MC) 法では、無限小の約数がサンプリング ノイズを増幅する可能性があるため、確率とその勾配を正確に評価できません。
この論文では、長期リスクの確率とその勾配を評価する効率的な方法を開発します。
提案された方法は、長期リスク確率が確率間の隣接関係を特徴付ける特定の偏微分方程式 (PDE) を満たすという事実を利用して、MC 方法と物理情報に基づくニューラル ネットワークを統合します。
トレーニング構成の特定の選択を考慮した推定誤差の理論的保証を提供します。
数値結果は、提案された方法がより良いサンプル効率を持ち、目に見えない領域までよく一般化し、パラメータが変化するシステムに適応できることを示しています。
提案された方法は、リスク確率の勾配を正確に推定することもできるため、リスク確率に関する一次および二次手法を学習および制御に使用できるようになります。

要約(オリジナル)

Accurate estimates of long-term risk probabilities and their gradients are critical for many stochastic safe control methods. However, computing such risk probabilities in real-time and in unseen or changing environments is challenging. Monte Carlo (MC) methods cannot accurately evaluate the probabilities and their gradients as an infinitesimal devisor can amplify the sampling noise. In this paper, we develop an efficient method to evaluate the probabilities of long-term risk and their gradients. The proposed method exploits the fact that long-term risk probability satisfies certain partial differential equations (PDEs), which characterize the neighboring relations between the probabilities, to integrate MC methods and physics-informed neural networks. We provide theoretical guarantees of the estimation error given certain choices of training configurations. Numerical results show the proposed method has better sample efficiency, generalizes well to unseen regions, and can adapt to systems with changing parameters. The proposed method can also accurately estimate the gradients of risk probabilities, which enables first- and second-order techniques on risk probabilities to be used for learning and control.

arxiv情報

著者 Zhuoyuan Wang,Yorie Nakahira
発行日 2024-01-04 17:19:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.SY, eess.SY パーマリンク