要約
安全制約の下で未知の機能を最適化することは、ロボット工学、生体医工学、その他多くの分野において中心的なタスクであり、これには安全性が高まっているベイジアン最適化 (BO) が使用されています。
これらのアプリケーションは安全性が重要であるため、これらのアルゴリズムの理論的な安全性の保証が現実の世界に反映されることが最も重要です。
この研究では、人気のあるクラスの SafeOpt タイプのアルゴリズムの 3 つの安全関連の問題を調査します。
まず、これらのアルゴリズムはガウス過程 (GP) 回帰の頻度主義的な不確実性限界に大きく依存していますが、具体的な実装では通常、すべての安全性の保証を無効にするヒューリスティックが利用されます。
私たちはこの問題の詳細な分析を提供し、最近の GP 限界を利用してすべての理論上の保証を保持する SafeOpt アルゴリズムのバリアントである Real-\b{eta}-SafeOpt を紹介します。
次に、ターゲット関数の再現カーネル ヒルベルト空間 (RKHS) ノルムの上限を仮定すること、これは SafeOpt のようなアルゴリズムにおける重要な技術的前提であり、現実世界での使用に対する中心的な障害であることを特定します。
この課題を克服するために、我々は、RKHS 限界を仮定せずに安全性を保証するリプシッツ限定の安全ベイジアン最適化 (LoSBO) アルゴリズムを導入し、このアルゴリズムが安全であるだけでなく、状態と比較して優れたパフォーマンスを発揮することを経験的に示します。
いくつかの関数クラスに関する最先端の技術。
第三に、SafeOpt および派生アルゴリズムは離散検索空間に依存しているため、高次元の問題に適用することが困難になります。
これらのアルゴリズムの適用範囲を広げるために、安全性を維持しながら中程度の高次元の問題に適用できる LoSBO の変形であるリプシッツ限定 GP-UCB (LoS-GP-UCB) を導入します。
要約(オリジナル)
Optimizing an unknown function under safety constraints is a central task in robotics, biomedical engineering, and many other disciplines, and increasingly safe Bayesian Optimization (BO) is used for this. Due to the safety critical nature of these applications, it is of utmost importance that theoretical safety guarantees for these algorithms translate into the real world. In this work, we investigate three safety-related issues of the popular class of SafeOpt-type algorithms. First, these algorithms critically rely on frequentist uncertainty bounds for Gaussian Process (GP) regression, but concrete implementations typically utilize heuristics that invalidate all safety guarantees. We provide a detailed analysis of this problem and introduce Real-\b{eta}-SafeOpt, a variant of the SafeOpt algorithm that leverages recent GP bounds and thus retains all theoretical guarantees. Second, we identify assuming an upper bound on the reproducing kernel Hilbert space (RKHS) norm of the target function, a key technical assumption in SafeOpt-like algorithms, as a central obstacle to real-world usage. To overcome this challenge, we introduce the Lipschitz-only Safe Bayesian Optimization (LoSBO) algorithm, which guarantees safety without an assumption on the RKHS bound, and empirically show that this algorithm is not only safe, but also exhibits superior performance compared to the state-of-the-art on several function classes. Third, SafeOpt and derived algorithms rely on a discrete search space, making them difficult to apply to higher-dimensional problems. To widen the applicability of these algorithms, we introduce Lipschitz-only GP-UCB (LoS-GP-UCB), a variant of LoSBO applicable to moderately high-dimensional problems, while retaining safety.
arxiv情報
著者 | Christian Fiedler,Johanna Menn,Lukas Kreisköther,Sebastian Trimpe |
発行日 | 2024-03-19 17:50:32+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google