Optimal Conditional Inference in Adaptive Experiments

要約

私たちは、バッチ化されたバンディット実験を研究し、実現された停止時間、割り当て確率、およびターゲットパラメータを条件とする推論の問題を検討します。ここで、これらはすべて、実験の最後のバッチまでの情報を使用して適応的に選択できます。
実験にさらなる制限がない場合、最後のバッチの結果のみを使用する推論が最適であることを示します。
実験の適応的側面が位置不変であることがわかっている場合、つまりすべてのバッチアーム平均を定数でシフトしても変化しないという意味で、追加の線形によって捕捉された追加情報がデータ内に存在することを示します。
バッチアーム手段の機能。
停止時間、割り当て確率、ターゲット パラメーターが多面体イベントの集合を通じてのみデータに依存することがわかっている、より限定的なケースでは、計算的に扱いやすい最適な条件付き推論手順を導き出します。

要約(オリジナル)

We study batched bandit experiments and consider the problem of inference conditional on the realized stopping time, assignment probabilities, and target parameter, where all of these may be chosen adaptively using information up to the last batch of the experiment. Absent further restrictions on the experiment, we show that inference using only the results of the last batch is optimal. When the adaptive aspects of the experiment are known to be location-invariant, in the sense that they are unchanged when we shift all batch-arm means by a constant, we show that there is additional information in the data, captured by one additional linear function of the batch-arm means. In the more restrictive case where the stopping time, assignment probabilities, and target parameter are known to depend on the data only through a collection of polyhedral events, we derive computationally tractable and optimal conditional inference procedures.

arxiv情報

著者 Jiafeng Chen,Isaiah Andrews
発行日 2023-09-21 15:17:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, econ.EM, math.ST, stat.ME, stat.TH パーマリンク