CATE Lasso: Conditional Average Treatment Effect Estimation with High-Dimensional Linear Regression

要約

2 つの治療法に関する因果推論では、条件付き平均治療効果 (CATE) が、共変量に基づいて条件付けされた 2 つの治療法の期待される結果の差として定義される、個別の因果効果を表す量として重要な役割を果たします。
この研究では、潜在的な結果と 2 つの治療の共変量の間に 2 つの線形回帰モデルがあると仮定し、CATE を線形回帰モデル間の差異として定義します。
次に、高次元で非スパースなパラメータの下でも一貫して CATE を推定する方法を提案します。
私たちの研究では、CATE の定義に由来する暗黙的なスパース性と呼ばれる弱い仮定を仮定すると、スパース性を明示的に仮定しなくても、一貫性などの望ましい理論的特性が引き続き達成可能であることを示しています。
この仮定では、潜在的な結果における線形モデルのパラメータは治療固有のパラメータと共通パラメータに分割できると仮定します。治療固有のパラメータは各線形回帰モデル間の差分値を取得しますが、共通パラメータは同一のままです。
したがって、2 つの線形回帰モデル間の差異では、共通のパラメーターが消失し、治療固有のパラメーターの差異のみが残ります。
したがって、CATE のゼロ以外のパラメーターは、治療固有のパラメーターの差に対応します。
この仮定を利用して、CATE 推定に特化した Lasso 回帰法を開発し、推定量が一貫していることを示します。
最後に、シミュレーション研究により提案手法の健全性を確認します。

要約(オリジナル)

In causal inference about two treatments, Conditional Average Treatment Effects (CATEs) play an important role as a quantity representing an individualized causal effect, defined as a difference between the expected outcomes of the two treatments conditioned on covariates. This study assumes two linear regression models between a potential outcome and covariates of the two treatments and defines CATEs as a difference between the linear regression models. Then, we propose a method for consistently estimating CATEs even under high-dimensional and non-sparse parameters. In our study, we demonstrate that desirable theoretical properties, such as consistency, remain attainable even without assuming sparsity explicitly if we assume a weaker assumption called implicit sparsity originating from the definition of CATEs. In this assumption, we suppose that parameters of linear models in potential outcomes can be divided into treatment-specific and common parameters, where the treatment-specific parameters take difference values between each linear regression model, while the common parameters remain identical. Thus, in a difference between two linear regression models, the common parameters disappear, leaving only differences in the treatment-specific parameters. Consequently, the non-zero parameters in CATEs correspond to the differences in the treatment-specific parameters. Leveraging this assumption, we develop a Lasso regression method specialized for CATE estimation and present that the estimator is consistent. Finally, we confirm the soundness of the proposed method by simulation studies.

arxiv情報

著者 Masahiro Kato,Masaaki Imaizumi
発行日 2023-10-25 17:51:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, econ.EM, stat.AP, stat.ME, stat.ML パーマリンク