要約
長期的な因果効果の推定は、多くのアプリケーションにおいて重要ですが困難な問題です。
既存の方法は、長期的な平均効果を推定するための理想的な仮定、たとえば、観察されていない交絡因子がないことや二元治療に依存していますが、多くの現実世界のアプリケーションでは、これらの仮定が破られる可能性があり、平均効果は個人レベルの提案を提供できません。
この論文では、観察されていない交絡因子を考慮しながら長期不均一用量反応曲線 (HDRC) を推定するという、より一般的な問題に取り組みます。
具体的には、観測データ内の観測されていない交絡を除去するために、理論的な保証を備えて観測データを実験データに合わせるための最適な輸送重み付けフレームワークを導入します。
さらに、連続治療の不均一な効果を正確に予測するために、最適な輸送によって引き起こされる再重み付けされた分布を活用することにより、反事実の予測誤差に対する一般化限界を確立します。
最後に、上記の理論的基礎に基づいて HDRC 推定器を開発します。
複数の合成および半合成データセットに対して行われた広範な実験研究により、提案された方法の有効性が実証されています。
要約(オリジナル)
Long-term causal effect estimation is a significant but challenging problem in many applications. Existing methods rely on ideal assumptions to estimate long-term average effects, e.g., no unobserved confounders or a binary treatment,while in numerous real-world applications, these assumptions could be violated and average effects are unable to provide individual-level suggestions.In this paper,we address a more general problem of estimating the long-term heterogeneous dose-response curve (HDRC) while accounting for unobserved confounders. Specifically, to remove unobserved confounding in observational data, we introduce an optimal transport weighting framework to align the observational data to the experimental data with theoretical guarantees. Furthermore,to accurately predict the heterogeneous effects of continuous treatment, we establish a generalization bound on counterfactual prediction error by leveraging the reweighted distribution induced by optimal transport. Finally, we develop an HDRC estimator building upon the above theoretical foundations. Extensive experimental studies conducted on multiple synthetic and semi-synthetic datasets demonstrate the effectiveness of our proposed method.
arxiv情報
著者 | Zeqin Yang,Weilin Chen,Ruichu Cai,Yuguang Yan,Zhifeng Hao,Zhipeng Yu,Zhichao Zou,Zhen Peng,Jiecheng Guo |
発行日 | 2024-06-27 14:13:46+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google