要約
この研究では、固定予算のベストアーム同定 (BAI) に対する漸近的局所ミニマックス最適アルゴリズムを調査します。
我々は、Generalized Neyman Allocation (GNA) アルゴリズムを提案し、最良のアームを誤認する確率の最悪の場合の上限が、スモールギャップ体制下での最悪の場合の下限と一致することを実証します。
最適なアームと次善のアームは小さいです。
下限と上限は厳密で、小さなギャップ領域内の定数項を含めて正確に一致します。
GNA アルゴリズムは、二腕盗賊に対するネイマン割り当て (Neyman、1934; Kaufmann et al.、2016) を一般化し、Glynn & Juneja (2004) によって提案されたアルゴリズムなどの既存の BAI アルゴリズムを改良します。
漸近的ミニマックス最適アルゴリズムを提案することで、あるクラスの分布を小さなギャップ領域に制限することで、BAI (Kaufmann, 2020) と治療選択 (Kasy & Sautmann, 202) における長年の未解決の問題に対処します。
要約(オリジナル)
This study investigates an asymptotically locally minimax optimal algorithm for fixed-budget best-arm identification (BAI). We propose the Generalized Neyman Allocation (GNA) algorithm and demonstrate that its worst-case upper bound on the probability of misidentifying the best arm aligns with the worst-case lower bound under the small-gap regime, where the gap between the expected outcomes of the best and suboptimal arms is small. Our lower and upper bounds are tight, matching exactly including constant terms within the small-gap regime. The GNA algorithm generalizes the Neyman allocation for two-armed bandits (Neyman, 1934; Kaufmann et al., 2016) and refines existing BAI algorithms, such as those proposed by Glynn & Juneja (2004). By proposing an asymptotically minimax optimal algorithm, we address the longstanding open issue in BAI (Kaufmann, 2020) and treatment choice (Kasy & Sautmann, 202) by restricting a class of distributions to the small-gap regimes.
arxiv情報
著者 | Masahiro Kato |
発行日 | 2024-12-23 17:43:05+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google