Approximating Counterfactual Bounds while Fusing Observational, Biased and Randomised Data Sources

要約

私たちは、最終的には構造因果モデルにおける反事実を計算するために、複数の、おそらく偏った観察研究と介入研究からのデータを統合するという問題に取り組みます。
選択バイアスの影響を受ける単一の観察データセットのケースから始めます。
利用可能なデータの尤度には極大値がないことを示します。
これにより、因果的期待値最大化スキームを使用して、部分的に特定可能な反事実クエリの境界を近似することが可能になります。これがこのホワイトペーパーの焦点です。
次に、同じアプローチで、介入か観察か、偏りがあるか不偏かに関係なく、複数のデータセットの一般的なケースに、グラフィカル変換を介して前者のデータセットに再マッピングすることでどのように対処できるかを示します。
緩和ケアに関する体系的な数値実験とケーススタディは、私たちのアプローチの有効性を示すとともに、部分的に識別可能である場合に有益な結果を得るために異種データソースを融合する利点を示唆しています。

要約(オリジナル)

We address the problem of integrating data from multiple, possibly biased, observational and interventional studies, to eventually compute counterfactuals in structural causal models. We start from the case of a single observational dataset affected by a selection bias. We show that the likelihood of the available data has no local maxima. This enables us to use the causal expectation-maximisation scheme to approximate the bounds for partially identifiable counterfactual queries, which are the focus of this paper. We then show how the same approach can address the general case of multiple datasets, no matter whether interventional or observational, biased or unbiased, by remapping it into the former one via graphical transformations. Systematic numerical experiments and a case study on palliative care show the effectiveness of our approach, while hinting at the benefits of fusing heterogeneous data sources to get informative outcomes in case of partial identifiability.

arxiv情報

著者 Marco Zaffalon,Alessandro Antonucci,Rafael Cabañas,David Huber
発行日 2023-07-31 11:28:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, stat.ME パーマリンク