On the role of surrogates in the efficient estimation of treatment effects with limited outcome data

要約

多くの実験や観察研究では、目的の結果を観察するのが困難または費用がかかることが多く、特定可能な場合でも平均治療効果(ATE)を推定するための有効なサンプルサイズが減少します。
私たちは、主に関心のない代理結果のみが観察されるユニットのデータを組み込むことで、ATE 推定の精度がどのように向上するかを研究します。
私たちは、目標結果の完全な代替として代理を許可する、厳格な代理条件を課すことを控えます。
代わりに、ランダムな割り当て、欠損、および対応する重複条件を超える仮定を行わずに、限定的ではあるものの、利用可能なターゲット結果の観測値 (それ自体で ATE を識別する) を、代理結果の豊富な観測値で補完します。
潜在的な利益を定量化するために、圧倒的な数または同程度の数のユニットで結果が欠落している場合の、サロゲートを使用した場合と使用しない場合の ATE 推定の効率限界の差を導き出します。
私たちは、これらの効率向上を実現する堅牢な ATE 推定および推論手法を開発します。
私たちは、職業訓練の長期的な収益効果を研究することで、その利益が実証されることを実証しています。

要約(オリジナル)

In many experiments and observational studies, the outcome of interest is often difficult or expensive to observe, reducing effective sample sizes for estimating average treatment effects (ATEs) even when identifiable. We study how incorporating data on units for which only surrogate outcomes not of primary interest are observed can increase the precision of ATE estimation. We refrain from imposing stringent surrogacy conditions, which permit surrogates as perfect replacements for the target outcome. Instead, we supplement the available, albeit limited, observations of the target outcome (which by themselves identify the ATE) with abundant observations of surrogate outcomes, without any assumptions beyond random assignment and missingness and corresponding overlap conditions. To quantify the potential gains, we derive the difference in efficiency bounds on ATE estimation with and without surrogates, both when an overwhelming or comparable number of units have missing outcomes. We develop robust ATE estimation and inference methods that realize these efficiency gains. We empirically demonstrate the gains by studying the long-term-earning effects of job training.

arxiv情報

著者 Nathan Kallus,Xiaojie Mao
発行日 2024-05-14 16:44:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ME, stat.ML パーマリンク