Transfer Causal Learning: Causal Effect Estimation with Knowledge Transfer

要約

同じ共変量 (または特徴) 空間設定、つまり同次転移学習 (TL) の下での知識伝達の助けを借りて因果効果の推定精度を向上させるという新しい問題が研究されており、転移因果学習 (TCL) 問題と呼ばれます。
平均因果効果 (ACE) を推定するために TL 手法を適応させる最近の取り組みは、不均一共変量空間設定に焦点を当てていますが、これらの手法は、アルゴリズム設計が共有およびドメイン固有への分解に基づいているため、TCL 問題に取り組むには不十分です。
共変量空間。
この問題に対処するために、$\ell_1$-TCL と呼ばれる汎用フレームワークを提案します。これには、迷惑パラメータ推定用の $\ell_1$ 正規化 TL と、結果回帰、逆確率重み付け、二重ロバスト推定器を含む下流プラグイン ACE 推定器が組み込まれています。

最も重要なことは、高次元回帰の Lasso の助けを借りて、提案された $\ell_1$-TCL のスパース性仮定の下で一般化線形モデル (GLM) の非漸近回復保証を確立することです。
経験的な観点から見ると、$\ell_1$-TCL は、GLM だけでなく、最近開発された多くのノンパラメトリック手法を組み込むことができる汎用学習フレームワークであり、モデルの仕様ミスに対する堅牢性を高めることができます。
我々は、GLM と最近のニューラル ネットワーク ベースのアプローチの両方を $\ell_1$-TCL に組み込むことにより、広範な数値シミュレーションを通じてこの経験的利点を実証します。これにより、ACE 推定に対する既存の TL アプローチと比較してパフォーマンスが向上することがわかります。
さらに、私たちの $\ell_1$-TCL フレームワークはその後実際の研究に適用され、昇圧剤療法が敗血症患者の 28 日死亡を予防できる可能性があることを明らかにしましたが、これはすべてのベースラインアプローチでは示されていません。

要約(オリジナル)

A novel problem of improving causal effect estimation accuracy with the help of knowledge transfer under the same covariate (or feature) space setting, i.e., homogeneous transfer learning (TL), is studied, referred to as the Transfer Causal Learning (TCL) problem. While most recent efforts in adapting TL techniques to estimate average causal effect (ACE) have been focused on the heterogeneous covariate space setting, those methods are inadequate for tackling the TCL problem since their algorithm designs are based on the decomposition into shared and domain-specific covariate spaces. To address this issue, we propose a generic framework called $\ell_1$-TCL, which incorporates $\ell_1$ regularized TL for nuisance parameter estimation and downstream plug-in ACE estimators, including outcome regression, inverse probability weighted, and doubly robust estimators. Most importantly, with the help of Lasso for high-dimensional regression, we establish non-asymptotic recovery guarantees for the generalized linear model (GLM) under the sparsity assumption for the proposed $\ell_1$-TCL. From an empirical perspective, $\ell_1$-TCL is a generic learning framework that can incorporate not only GLM but also many recently developed non-parametric methods, which can enhance robustness to model mis-specification. We demonstrate this empirical benefit through extensive numerical simulation by incorporating both GLM and recent neural network-based approaches in $\ell_1$-TCL, which shows improved performance compared with existing TL approaches for ACE estimation. Furthermore, our $\ell_1$-TCL framework is subsequently applied to a real study, revealing that vasopressor therapy could prevent 28-day mortality within septic patients, which all baseline approaches fail to show.

arxiv情報

著者 Song Wei,Ronald Moore,Hanyu Zhang,Yao Xie,Rishikesan Kamaleswaran
発行日 2023-05-23 16:46:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.ST, stat.ME, stat.ML, stat.TH パーマリンク