Tightening Bounds on Probabilities of Causation By Merging Datasets

要約

因果関係の確率 (PoC) は、法律、医療、公共政策における意思決定において基本的な役割を果たします。
それにもかかわらず、それらの点の特定は困難であり、強力な仮定が必要であり、それが存在しない場合は境界のみを導き出すことができます。
追加の情報を活用してこれらの境界をさらに厳しくする既存の研究では、数値境界または固定次元の記号境界を提供するか、同じ治療変数と結果変数を含む複数のデータセットへのアクセスが必要になります。
しかし、多くの臨床、疫学、公共政策への応用では、同じ結果変数に対する異なる治療法の効果を調べたり、共変量と結果変数間の関連を研究したりする外部データセットが存在します。
これらの外部データセットは、前述の境界と組み合わせて使用​​することはできません。前者は、異なる治療割り当てメカニズムを必要としたり、異なる因果構造に従う可能性があるためです。
ここでは、この困難なシナリオの PoC に記号的な境界を提供します。
私たちは、因果関係十分性を仮定して、異なる治療法を研究する 2 つのランダム化実験、またはランダム化実験と観察研究のいずれかを組み合わせることに焦点を当てています。
私たちのシンボリック境界は共変量と処理の任意の次元に機能し、これらの境界が文献の既存の境界よりも厳しくなる条件について議論します。
最後に、境界はデータセット間の治療割り当てメカニズムの違いをパラメーター化し、メカニズムをデータセット間で変更できるようにしながら、因果関係の情報を外部データセットからターゲット データセットに転送できるようにします。

要約(オリジナル)

Probabilities of Causation (PoC) play a fundamental role in decision-making in law, health care and public policy. Nevertheless, their point identification is challenging, requiring strong assumptions, in the absence of which only bounds can be derived. Existing work to further tighten these bounds by leveraging extra information either provides numerical bounds, symbolic bounds for fixed dimensionality, or requires access to multiple datasets that contain the same treatment and outcome variables. However, in many clinical, epidemiological and public policy applications, there exist external datasets that examine the effect of different treatments on the same outcome variable, or study the association between covariates and the outcome variable. These external datasets cannot be used in conjunction with the aforementioned bounds, since the former may entail different treatment assignment mechanisms, or even obey different causal structures. Here, we provide symbolic bounds on the PoC for this challenging scenario. We focus on combining either two randomized experiments studying different treatments, or a randomized experiment and an observational study, assuming causal sufficiency. Our symbolic bounds work for arbitrary dimensionality of covariates and treatment, and we discuss the conditions under which these bounds are tighter than existing bounds in literature. Finally, our bounds parameterize the difference in treatment assignment mechanism across datasets, allowing the mechanisms to vary across datasets while still allowing causal information to be transferred from the external dataset to the target dataset.

arxiv情報

著者 Numair Sani,Atalanti A. Mastakouri
発行日 2023-10-12 15:19:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, math.ST, stat.TH パーマリンク