要約
実用的および倫理的な制約では、多くの場合、特に医学と社会科学において、因果推論のために観察データを使用する必要があります。
しかし、観察データセットは交絡する傾向があり、因果的結論の妥当性を潜在的に損なう傾向があります。
根本的な因果グラフがわかっている場合、バイアスを修正することは可能ですが、実際のシナリオではこれが実行可能な質問ではありません。
一般的な戦略は、利用可能なすべての共変量を調整することですが、このアプローチは、特に治療後または観測されていない変数が存在する場合、偏った治療効果の推定値をもたらすことができます。
基礎となる因果グラフを知るか学習する必要なく、複数のデータソースの不均一性を活用することにより、偏りのない治療効果の推定値を生成するアルゴリズムであるラーメンを提案します。
特に、ラーメンは二重に堅牢な識別を実現します。治療の因果的な親または結果の親が観察されるたびに、治療効果を識別でき、両親が観察されたノードが不変性の仮定を満たします。
合成および実世界のデータセットに関する経験的評価は、私たちのアプローチが既存の方法よりも優れていることを示しています。
要約(オリジナル)
Practical and ethical constraints often require the use of observational data for causal inference, particularly in medicine and social sciences. Yet, observational datasets are prone to confounding, potentially compromising the validity of causal conclusions. While it is possible to correct for biases if the underlying causal graph is known, this is rarely a feasible ask in practical scenarios. A common strategy is to adjust for all available covariates, yet this approach can yield biased treatment effect estimates, especially when post-treatment or unobserved variables are present. We propose RAMEN, an algorithm that produces unbiased treatment effect estimates by leveraging the heterogeneity of multiple data sources without the need to know or learn the underlying causal graph. Notably, RAMEN achieves doubly robust identification: it can identify the treatment effect whenever the causal parents of the treatment or those of the outcome are observed, and the node whose parents are observed satisfies an invariance assumption. Empirical evaluations on synthetic and real-world datasets show that our approach outperforms existing methods.
arxiv情報
著者 | Piersilvio De Bartolomeis,Julia Kostin,Javier Abad,Yixin Wang,Fanny Yang |
発行日 | 2025-03-18 17:33:10+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google