Generative Adversarial Bayesian Optimization for Surrogate Objectives

要約

オフラインのモデルベースのポリシー最適化では、最適化中に真のオラクル目標をクエリすることなく、学習されたサロゲート目的関数を最適化しようとします。
ただし、最適化の軌道に沿って、不正確な代理モデルの予測が頻繁に発生します。
この制限に対処するために、適応ソース クリティカル正則化を使用した敵対的生成ベイジアン最適化 (GABO) を提案します。これは、リプシッツ有界ソース クリティカル モデルを使用して、サロゲート関数が信頼できる領域に最適化の軌道を制約するタスクに依存しないベイジアン最適化フレームワークです。

事前の連続入力空間に対する特定の仮定の下で、アルゴリズムがソース批判正則化の強度を動的に調整することを示します。
GABO は、さまざまな科学分野にわたるさまざまなオフライン最適化タスクにおいて、既存のベースラインを上回るパフォーマンスを発揮します。
私たちのコードは https://github.com/michael-s-yao/gabo で入手できます。

要約(オリジナル)

Offline model-based policy optimization seeks to optimize a learned surrogate objective function without querying the true oracle objective during optimization. However, inaccurate surrogate model predictions are frequently encountered along the optimization trajectory. To address this limitation, we propose generative adversarial Bayesian optimization (GABO) using adaptive source critic regularization, a task-agnostic framework for Bayesian optimization that employs a Lipschitz-bounded source critic model to constrain the optimization trajectory to regions where the surrogate function is reliable. We show that under certain assumptions for the continuous input space prior, our algorithm dynamically adjusts the strength of the source critic regularization. GABO outperforms existing baselines on a number of different offline optimization tasks across a variety of scientific domains. Our code is available at https://github.com/michael-s-yao/gabo

arxiv情報

著者 Michael S. Yao,Yimeng Zeng,Hamsa Bastani,Jacob Gardner,James C. Gee,Osbert Bastani
発行日 2024-02-09 16:43:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク