要約
現実世界の因果推論タスクでは、バイナリ処理変数ではなく連続処理変数に対する反事実推論の方が一般的です。
交絡バイアスを排除するための限界構造モデルに基づくサンプルの再重み付け方法はすでにいくつかありますが、それらは一般に、交絡因子に対する治療の線形依存性を除去することに焦点を当てており、通常は検証不可能である想定されたパラメトリック モデルの精度に依存しています。
この論文では、治療変数ともつれを解いた共変量の表現を生成することにより、継続的治療の反事実的な結果を推定するための脱交絡表現学習 (DRL) フレームワークを提案します。
DRL は、治療と共変量間の線形依存性と非線形依存性の両方を排除するノンパラメトリック モデルです。
具体的には、交絡バイアスを排除するために、共変量表現と治療変数の間の相関に対して、脱交絡表現と治療変数の間の相関をトレーニングします。
さらに、反事実推論ネットワークがフレームワークに組み込まれており、学習された表現が交絡の解消と信頼できる推論の両方に役立つようになります。
合成データセットに対する広範な実験により、DRL モデルは交絡を取り除く表現の学習において優れたパフォーマンスを発揮し、連続治療変数については最先端の反事実推論モデルを上回るパフォーマンスを示すことが示されています。
さらに、DRL モデルを現実世界の医療データセット MIMIC に適用し、赤血球の幅の分布と死亡率との詳細な因果関係を実証します。
要約(オリジナル)
Counterfactual inference for continuous rather than binary treatment variables is more common in real-world causal inference tasks. While there are already some sample reweighting methods based on Marginal Structural Model for eliminating the confounding bias, they generally focus on removing the treatment’s linear dependence on confounders and rely on the accuracy of the assumed parametric models, which are usually unverifiable. In this paper, we propose a de-confounding representation learning (DRL) framework for counterfactual outcome estimation of continuous treatment by generating the representations of covariates disentangled with the treatment variables. The DRL is a non-parametric model that eliminates both linear and nonlinear dependence between treatment and covariates. Specifically, we train the correlations between the de-confounded representations and the treatment variables against the correlations between the covariate representations and the treatment variables to eliminate confounding bias. Further, a counterfactual inference network is embedded into the framework to make the learned representations serve both de-confounding and trusted inference. Extensive experiments on synthetic datasets show that the DRL model performs superiorly in learning de-confounding representations and outperforms state-of-the-art counterfactual inference models for continuous treatment variables. In addition, we apply the DRL model to a real-world medical dataset MIMIC and demonstrate a detailed causal relationship between red cell width distribution and mortality.
arxiv情報
著者 | Yonghe Zhao,Qiang Huang,Haolong Zeng,Yun Pen,Huiyan Sun |
発行日 | 2023-07-24 08:56:25+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google