Minimax Optimal Simple Regret in Two-Armed Best-Arm Identification

要約

この研究では、2 アーム固定予算ベストアーム同定 (BAI) 問題における漸近的ミニマックス最適アルゴリズムを調査します。
2 つの治療群が与えられた場合、その目的は、適応実験を通じて期待される結果が最も高い治療群を特定することです。
我々は、結果の標準偏差の比率に従って治療群が割り当てられるネイマン割り当てに焦点を当てます。
私たちの主な貢献は、真の最良のアームと推定された最良のアームの期待される結果の差として定義される、単純な後悔に対するネイマン割り当てのミニマックス最適性を証明することです。
具体的には、最初に、ガウス分布を含む位置シフト分布の下で達成可能な最悪の場合のパフォーマンスを特徴付ける、予想される単純なリグレスのミニマックス下限を導出します。
次に、最悪の場合の分布の下で、サンプル サイズに関する率だけでなく、定数項も含めて、ネイマン割り当ての単純な後悔がこの下限に漸近的に一致することを示します。
特に、最適性の結果は、局所漸近正規性などの局所性制限を分布に課すことなく成立します。
さらに、ベルヌーイ分布の下では、ネイマン配分が均一配分、つまり標準的なランダム化比較試験に縮小されることを示します。

要約(オリジナル)

This study investigates an asymptotically minimax optimal algorithm in the two-armed fixed-budget best-arm identification (BAI) problem. Given two treatment arms, the objective is to identify the arm with the highest expected outcome through an adaptive experiment. We focus on the Neyman allocation, where treatment arms are allocated following the ratio of their outcome standard deviations. Our primary contribution is to prove the minimax optimality of the Neyman allocation for the simple regret, defined as the difference between the expected outcomes of the true best arm and the estimated best arm. Specifically, we first derive a minimax lower bound for the expected simple regret, which characterizes the worst-case performance achievable under the location-shift distributions, including Gaussian distributions. We then show that the simple regret of the Neyman allocation asymptotically matches this lower bound, including the constant term, not just the rate in terms of the sample size, under the worst-case distribution. Notably, our optimality result holds without imposing locality restrictions on the distribution, such as the local asymptotic normality. Furthermore, we demonstrate that the Neyman allocation reduces to the uniform allocation, i.e., the standard randomized controlled trial, under Bernoulli distributions.

arxiv情報

著者 Masahiro Kato
発行日 2024-12-23 18:06:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, econ.EM, math.ST, stat.AP, stat.ML, stat.TH パーマリンク