A Causal Framework for Decomposing Spurious Variations

要約

データ サイエンス全体で見られる基本的な課題の 1 つは、なぜ物事が特定の方法で起こるのか、または特定の変数 $X$ が別の変数 $Y$ に影響を与えるメカニズムを説明することです。
統計と機械学習では、変数間の相関を効率的に推定するための機械の開発に多大な努力が払われてきました。
因果推論では、多くの文献が媒介分析のルーブリックに基づく因果効果の分解に関係しています。
しかし、応用科学全体にわたるさまざまな現象を含め、多くのバリエーションは本質的に偽りです。
相関関係を推定する統計的な能力と因果関係を分解する識別能力にもかかわらず、偽の関連性の特性と、それが根底にある因果メカニズムの観点からどのように分解できるかについては、まだほとんど理解されていません。
この原稿では、マルコフ モデルとセミマルコフ モデルの両方でスプリアス変動を分解するための正式なツールを開発します。
我々は、スプリアス効果のノンパラメトリック分解を可能にし、そのような分解を識別するための十分な条件を提供する最初の結果を証明します。
説明されているアプローチには、説明可能で公正な AI から疫学や医学の質問に至るまで、いくつかの応用例があり、私たちは現実世界のデータセットでのその使用法を実証的に示しています。

要約(オリジナル)

One of the fundamental challenges found throughout the data sciences is to explain why things happen in specific ways, or through which mechanisms a certain variable $X$ exerts influences over another variable $Y$. In statistics and machine learning, significant efforts have been put into developing machinery to estimate correlations across variables efficiently. In causal inference, a large body of literature is concerned with the decomposition of causal effects under the rubric of mediation analysis. However, many variations are spurious in nature, including different phenomena throughout the applied sciences. Despite the statistical power to estimate correlations and the identification power to decompose causal effects, there is still little understanding of the properties of spurious associations and how they can be decomposed in terms of the underlying causal mechanisms. In this manuscript, we develop formal tools for decomposing spurious variations in both Markovian and Semi-Markovian models. We prove the first results that allow a non-parametric decomposition of spurious effects and provide sufficient conditions for the identification of such decompositions. The described approach has several applications, ranging from explainable and fair AI to questions in epidemiology and medicine, and we empirically demonstrate its use on a real-world dataset.

arxiv情報

著者 Drago Plecko,Elias Bareinboim
発行日 2023-06-08 09:40:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, stat.ME, stat.ML パーマリンク