Bayesian Optimization with Formal Safety Guarantees via Online Conformal Prediction

要約

ブラックボックス 0 次最適化は、金融、物理学、工学などのさまざまな分野のアプリケーションの中心的なプリミティブです。
この問題の一般的な定式化では、設計者は候補となる解決策を順番に試行し、各試行の値に関するノイズの多いフィードバックをシステムから受け取ります。
このペーパーでは、試行された解決策の安全性についてもフィードバックが提供され、最適化プロセス全体で試行される安全でない解決策の数を制限するようにオプティマイザーが制約されるシナリオを研究します。
ベイジアン最適化(BO)に基づく方法に焦点を当て、従来技術は、安全性について厳密な仮定がある限り、フィードバックノイズに対して制御可能な確率で安全でない解を選択しないことが保証される、SAFEOPTと呼ばれる最適化スキームを導入している。
制約関数が満たされています。
この論文では、制約関数の特性に関係なく安全要件を満たす新しい BO ベースのアプローチを紹介します。
この強力な理論的保証は、任意で制御可能だがゼロではない安全制約違反率を許容するという代償を払って得られます。
SAFE-BOCP と呼ばれる提案された方法は、オンライン等角予測 (CP) に基づいており、安全制約に関するフィードバックがノイズがない場合とノイズが多い場合に特化しています。
合成データと現実世界のデータに関する実験結果により、提案されている SAFE-BOCP の利点と柔軟性が検証されています。

要約(オリジナル)

Black-box zero-th order optimization is a central primitive for applications in fields as diverse as finance, physics, and engineering. In a common formulation of this problem, a designer sequentially attempts candidate solutions, receiving noisy feedback on the value of each attempt from the system. In this paper, we study scenarios in which feedback is also provided on the safety of the attempted solution, and the optimizer is constrained to limit the number of unsafe solutions that are tried throughout the optimization process. Focusing on methods based on Bayesian optimization (BO), prior art has introduced an optimization scheme — referred to as SAFEOPT — that is guaranteed not to select any unsafe solution with a controllable probability over feedback noise as long as strict assumptions on the safety constraint function are met. In this paper, a novel BO-based approach is introduced that satisfies safety requirements irrespective of properties of the constraint function. This strong theoretical guarantee is obtained at the cost of allowing for an arbitrary, controllable but non-zero, rate of violation of the safety constraint. The proposed method, referred to as SAFE-BOCP, builds on online conformal prediction (CP) and is specialized to the cases in which feedback on the safety constraint is either noiseless or noisy. Experimental results on synthetic and real-world data validate the advantages and flexibility of the proposed SAFE-BOCP.

arxiv情報

著者 Yunchuan Zhang,Sangwoo Park,Osvaldo Simeone
発行日 2023-06-30 17:26:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.IT, cs.LG, eess.SP, math.IT パーマリンク