Prior-Dependent Allocations for Bayesian Fixed-Budget Best-Arm Identification in Structured Bandits

要約

我々は、構造化されたバンディットにおけるベイジアン固定予算ベストアーム同定 (BAI) の問題を研究します。
事前情報と環境の構造に基づいて固定割り当てを使用するアルゴリズムを提案します。
線形および階層型 BAI の最初の事前依存上限を含む、さまざまなモデルにわたるパフォーマンスの理論的限界を提供します。
私たちの主な貢献は、既存の方法と比較してマルチアーム BAI の境界をより厳密にする新しい証明方法を導入したことです。
私たちは、当社のアプローチを他の固定予算の BAI 手法と徹底的に比較し、さまざまな設定でその一貫した堅牢なパフォーマンスを実証しています。
私たちの研究により、構造化された盗賊におけるベイジアン固定予算 BAI の理解が深まり、実際のシナリオにおける私たちのアプローチの有効性が強調されます。

要約(オリジナル)

We study the problem of Bayesian fixed-budget best-arm identification (BAI) in structured bandits. We propose an algorithm that uses fixed allocations based on the prior information and the structure of the environment. We provide theoretical bounds on its performance across diverse models, including the first prior-dependent upper bounds for linear and hierarchical BAI. Our key contribution is introducing new proof methods that result in tighter bounds for multi-armed BAI compared to existing methods. We extensively compare our approach to other fixed-budget BAI methods, demonstrating its consistent and robust performance in various settings. Our work improves our understanding of Bayesian fixed-budget BAI in structured bandits and highlights the effectiveness of our approach in practical scenarios.

arxiv情報

著者 Nicolas Nguyen,Imad Aouali,András György,Claire Vernade
発行日 2024-02-08 18:13:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク