Statistical Inference After Adaptive Sampling for Longitudinal Data




– オンライン強化学習や適応サンプリングアルゴリズムは、デジタル介入実験において治療の最適化に使用される。
– 適応サンプリングによってデータを蓄積し、より速く学習することができる。
– ユーザー間でデータを組み合わせることで、標準の分散推定量が真の分散を過小評価する可能性がある。
– 適応的にサンプリングされたデータに対する新しい方法を、Z-estimationを介して開発する。
– 適応性のあるサンドイッチ分散推定量を紹介し、修正されたサンドイッチ推定量を導く。
– 縦断的データに対する経験過程の新しい理論的ツールを開発する。
– 統計推論が実験後の分析に欠かせないことが示される。


Online reinforcement learning and other adaptive sampling algorithms are increasingly used in digital intervention experiments to optimize treatment delivery for users over time. In this work, we focus on longitudinal user data collected by a large class of adaptive sampling algorithms that are designed to optimize treatment decisions online using accruing data from multiple users. Combining or ‘pooling’ data across users allows adaptive sampling algorithms to potentially learn faster. However, by pooling, these algorithms induce dependence between the sampled user data trajectories; we show that this can cause standard variance estimators for i.i.d. data to underestimate the true variance of common estimators on this data type. We develop novel methods to perform a variety of statistical analyses on such adaptively sampled data via Z-estimation. Specifically, we introduce the \textit{adaptive} sandwich variance estimator, a corrected sandwich estimator that leads to consistent variance estimates under adaptive sampling. Additionally, to prove our results we develop novel theoretical tools for empirical processes on non-i.i.d., adaptively sampled longitudinal data which may be of independent interest. This work is motivated by our efforts in designing experiments in which online reinforcement learning algorithms optimize treatment decisions, yet statistical inference is essential for conducting analyses after experiments conclude.


著者 Kelly W. Zhang,Lucas Janson,Susan A. Murphy
発行日 2023-04-19 04:20:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.LG, stat.ME パーマリンク