要約
構造的因果モデルの反事実を最終的に計算するために、複数の、おそらく偏った、観察的および介入的研究からのデータを統合する問題に対処します。
選択バイアスの影響を受ける単一の観測データセットのケースから始めます。
利用可能なデータの尤度には極大値がないことを示します。
これにより、因果的期待値最大化スキームを使用して、部分的に識別可能な反事実クエリの近似境界を計算することができます。これが、このペーパーの焦点です。
次に、グラフィカルな変換を介して前者のデータセットに再マッピングすることにより、介入または観察、偏りがあるかどうかに関係なく、同じアプローチが複数のデータセットの一般的なケースをどのように解決できるかを示します。
体系的な数値実験と緩和ケアのケーススタディは、私たちのアプローチの有効性と正確性を示し、部分的な識別可能性の場合に有益な境界を得るために異種データを統合する利点を示唆しています。
要約(オリジナル)
We address the problem of integrating data from multiple, possibly biased, observational and interventional studies, to eventually compute counterfactuals in structural causal models. We start from the case of a single observational dataset affected by a selection bias. We show that the likelihood of the available data has no local maxima. This enables us to use the causal expectation-maximisation scheme to compute approximate bounds for partially identifiable counterfactual queries, which are the focus of this paper. We then show how the same approach can solve the general case of multiple datasets, no matter whether interventional or observational, biased or unbiased, by remapping it into the former one via graphical transformations. Systematic numerical experiments and a case study on palliative care show the effectiveness and accuracy of our approach, while hinting at the benefits of integrating heterogeneous data to get informative bounds in case of partial identifiability.
arxiv情報
著者 | Marco Zaffalon,Alessandro Antonucci,David Huber,Rafael Cabañas |
発行日 | 2023-03-16 14:41:18+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google