要約
この研究では、固定予算のベストアーム同定 (BAI) のための局所漸近ミニマックス最適戦略を調査します。
我々は、適応型一般化ネイマン配分 (AGNA) 戦略を提案し、最良のアームを誤認する確率の最悪の場合の上限が、期待される結果間のギャップが小さいギャップ領域における最悪の場合の下限と一致することを示します。
最良のアームと次善のアームの数は少ない。
私たちの戦略は、二腕盗賊に対するネイマン割り当て (Neyman、1934; Kaufmann et al.、2016) の一般化と、Glynn & Juneja (2004) や Shin et al. によって提案された戦略などの既存の戦略の改良に対応しています。
(2018年)。
小宮山らと比較。
(2022) はミニマックス レート最適化戦略を提案していますが、私たちが提案する戦略は、分布のクラスをギャップの小さい分布のクラスに制限することにより、定数項を含めて下限と正確に一致するより厳しい上限を持ちます。
私たちの結果は、局所漸近ミニマックス最適戦略を提示することにより、固定予算 BAI における漸近最適戦略の存在に関する長年の未解決の問題に貢献します。
要約(オリジナル)
This study investigates a local asymptotic minimax optimal strategy for fixed-budget best arm identification (BAI). We propose the Adaptive Generalized Neyman Allocation (AGNA) strategy and show that its worst-case upper bound of the probability of misidentifying the best arm aligns with the worst-case lower bound under the small-gap regime, where the gap between the expected outcomes of the best and suboptimal arms is small. Our strategy corresponds to a generalization of the Neyman allocation for two-armed bandits (Neyman, 1934; Kaufmann et al., 2016) and a refinement of existing strategies such as the ones proposed by Glynn & Juneja (2004) and Shin et al. (2018). Compared to Komiyama et al. (2022), which proposes a minimax rate-optimal strategy, our proposed strategy has a tighter upper bound that exactly matches the lower bound, including the constant terms, by restricting the class of distributions to the class of small-gap distributions. Our result contributes to the longstanding open issue about the existence of asymptotically optimal strategies in fixed-budget BAI, by presenting the local asymptotic minimax optimal strategy.
arxiv情報
著者 | Masahiro Kato |
発行日 | 2024-05-29 17:43:13+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google