Semiparametric Efficient Inference in Adaptive Experiments

要約

治療または対照への被験者の割り当てを管理するポリシーが時間の経過とともに変化する可能性がある連続実験における平均治療効果の効率的な推論の問題を検討します。
まず、適応拡張逆確率加重推定器の中心極限定理を提供します。これは、文献で以前に作成されたものよりも弱い仮定の下で、セミパラメトリック効率的です。
この中心極限定理により、固定サンプル サイズでの効率的な推論が可能になります。
次に、逐次推論設定を検討し、以前の方法よりもかなり厳密な漸近的および非漸近的信頼シーケンスの両方を導き出します。
これらのいつでも有効なメソッドは、データに依存する停止時間 (サンプル サイズ) の下での推論を可能にします。
さらに、最近のオフポリシー推定文献からの傾向スコア切り捨て手法を使用して、漸近分散に影響を与えることなく推定量の有限サンプル分散を削減します。
経験的な結果は、私たちの方法が、時間均一の誤差制御を維持しながら、文献で以前に開発されたものよりも狭い信頼シーケンスを生成することを示しています。

要約(オリジナル)

We consider the problem of efficient inference of the Average Treatment Effect in a sequential experiment where the policy governing the assignment of subjects to treatment or control can change over time. We first provide a central limit theorem for the Adaptive Augmented Inverse-Probability Weighted estimator, which is semiparametric efficient, under weaker assumptions than those previously made in the literature. This central limit theorem enables efficient inference at fixed sample sizes. We then consider a sequential inference setting, deriving both asymptotic and nonasymptotic confidence sequences that are considerably tighter than previous methods. These anytime-valid methods enable inference under data-dependent stopping times (sample sizes). Additionally, we use propensity score truncation techniques from the recent off-policy estimation literature to reduce the finite sample variance of our estimator without affecting the asymptotic variance. Empirical results demonstrate that our methods yield narrower confidence sequences than those previously developed in the literature while maintaining time-uniform error control.

arxiv情報

著者 Thomas Cook,Alan Mishler,Aaditya Ramdas
発行日 2023-12-14 18:24:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ME, stat.ML パーマリンク