要約
限られたデータにおける因果効果の推定精度を向上させることを目的として、ターゲット ドメインとソース ドメインが同じ共変量/特徴空間を共有する場合の転移因果学習 (TCL) フレームワークを紹介します。
敗血症などのまれな病状が対象となる医療アプリケーションでは、限られたデータが非常に一般的です。
\texttt{$\ell_1$-TCL} と名付けられた私たちの提案手法には、迷惑モデル (傾向スコア モデルなど) 用の $\ell_1$ 正規化 TL が組み込まれています。
迷惑パラメータの TL 推定量は、下流の平均因果/治療効果推定量 (たとえば、逆確率重み付け推定量) に接続されます。
私たちは、高次元設定におけるスパース性の仮定の下で、一般化線形モデル (GLM) を使用して \texttt{$\ell_1$-TCL} の非漸近回復保証を確立し、\texttt{$\ell_1$ の経験的利点を実証します。
-TCL} GLM および最近のニューラル ネットワーク迷惑モデルの広範な数値シミュレーションによる。
その後、私たちの方法は実際のデータに拡張され、医学文献と一致する有意義な洞察が得られますが、これはすべてのベースライン方法が失敗する場合です。
要約(オリジナル)
We present a Transfer Causal Learning (TCL) framework when target and source domains share the same covariate/feature spaces, aiming to improve causal effect estimation accuracy in limited data. Limited data is very common in medical applications, where some rare medical conditions, such as sepsis, are of interest. Our proposed method, named \texttt{$\ell_1$-TCL}, incorporates $\ell_1$ regularized TL for nuisance models (e.g., propensity score model); the TL estimator of the nuisance parameters is plugged into downstream average causal/treatment effect estimators (e.g., inverse probability weighted estimator). We establish non-asymptotic recovery guarantees for the \texttt{$\ell_1$-TCL} with generalized linear model (GLM) under the sparsity assumption in the high-dimensional setting, and demonstrate the empirical benefits of \texttt{$\ell_1$-TCL} through extensive numerical simulation for GLM and recent neural network nuisance models. Our method is subsequently extended to real data and generates meaningful insights consistent with medical literature, a case where all baseline methods fail.
arxiv情報
著者 | Song Wei,Hanyu Zhang,Ronald Moore,Rishikesan Kamaleswaran,Yao Xie |
発行日 | 2024-01-01 17:04:58+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google