What Makes Treatment Effects Identifiable? Characterizations and Estimators Beyond Unconfoundedness

要約

因果推論における平均治療効果(ATE)の広く使用されている推定器のほとんどは、非影響力と重複の仮定に依存しています。
顕著な性能では、観測された共変量が結果と治療との間のすべての相関を説明する必要があります。
オーバーラップには、すべての個人の治療決定におけるランダム性の存在が必要です。
それにもかかわらず、多くの種類の研究は、頻繁に影響を及ぼしたり、重複していないことに違反しています。たとえば、決定論的な治療の決定を伴う観察研究(一般に回帰不連続設計として知られている)が重複しています。
このホワイトペーパーでは、平均的な治療効果の識別を可能にする一般的な条件の研究を開始し、影響を及ぼし、重複を超えて拡大します。
特に、統計学習理論のパラダイムに従って、ATEの識別に十分で必要な解釈可能な条件を提供します。
さらに、この状態は、治療を受けた(ATT)に対する平均治療効果の識別を特徴づけ、他の治療効果を特徴付けるためにも使用できます。
私たちの状態の有用性を説明するために、私たちの状態が満たされているいくつかのよく研究されたシナリオを提示します。したがって、以前の作品が捕らえられないというレジームでATが特定できることを証明します。
たとえば、データ分布に関する穏やかな仮定の下で、これはTan(2006)とRosenbaum(2002)によって提案されたモデル、およびThistlethwaite and Campbell(1960)によって導入された回帰の不連続設計モデルに当てはまります。
これらの各シナリオについて、自然な追加の仮定の下で、ATEは有限サンプルから推定できることも示しています。
これらの発見は、特に複雑な治療メカニズムを備えた観察研究において、学習理論的洞察と因果推論の方法論を橋渡しするための新しい道を開くと信じています。

要約(オリジナル)

Most of the widely used estimators of the average treatment effect (ATE) in causal inference rely on the assumptions of unconfoundedness and overlap. Unconfoundedness requires that the observed covariates account for all correlations between the outcome and treatment. Overlap requires the existence of randomness in treatment decisions for all individuals. Nevertheless, many types of studies frequently violate unconfoundedness or overlap, for instance, observational studies with deterministic treatment decisions — popularly known as Regression Discontinuity designs — violate overlap. In this paper, we initiate the study of general conditions that enable the identification of the average treatment effect, extending beyond unconfoundedness and overlap. In particular, following the paradigm of statistical learning theory, we provide an interpretable condition that is sufficient and nearly necessary for the identification of ATE. Moreover, this condition characterizes the identification of the average treatment effect on the treated (ATT) and can be used to characterize other treatment effects as well. To illustrate the utility of our condition, we present several well-studied scenarios where our condition is satisfied and, hence, we prove that ATE can be identified in regimes that prior works could not capture. For example, under mild assumptions on the data distributions, this holds for the models proposed by Tan (2006) and Rosenbaum (2002), and the Regression Discontinuity design model introduced by Thistlethwaite and Campbell (1960). For each of these scenarios, we also show that, under natural additional assumptions, ATE can be estimated from finite samples. We believe these findings open new avenues for bridging learning-theoretic insights and causal inference methodologies, particularly in observational studies with complex treatment mechanisms.

arxiv情報

著者 Yang Cai,Alkis Kalavasis,Katerina Mamali,Anay Mehrotra,Manolis Zampetakis
発行日 2025-06-04 17:40:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, econ.EM, math.ST, stat.ME, stat.ML, stat.TH パーマリンク