Root Cause Analysis of Outliers with Missing Structural Knowledge

要約

最近の研究では、構造因果モデル (SCM) の因果的反事実を使用した定量的寄与分析を介して、異常の根本原因分析 (RCA) を概念化しました。このフレームワークには 3 つの実際的な課題があります。(1) 因果有向非巡回グラフ (DAG) が必要です。
SCM、(2) 確率密度の低い領域で回帰モデルを調査するため、統計的に不適切な設定である、(3) 見つけるのに計算コストがかかる Shapley 値に依存している。
この論文では、定量的な寄与分析ではなく固有の根本原因を特定することがタスクである場合の、根本原因分析の簡略化された効率的な方法を提案します。
私たちが提案した手法は、SCM ノードの線形順序で実行され、反事実のない因果的な DAG のみを必要とします。
さらに、原因となる DAG が不明なユースケースでは、最も高い異常スコアを持つ変数として根本原因を特定するヒューリスティックを正当化します。
この目的を達成するために、小さなスコアの異常が大きなスコアの異常を引き起こす可能性が低いことを証明し、非単調な異常スコアによる因果経路の可能性の上限を示します。

要約(オリジナル)

Recent work conceptualized root cause analysis (RCA) of anomalies via quantitative contribution analysis using causal counterfactuals in structural causal models (SCMs).The framework comes with three practical challenges: (1) it requires the causal directed acyclic graph (DAG), together with an SCM, (2) it is statistically ill-posed since it probes regression models in regions of low probability density, (3) it relies on Shapley values which are computationally expensive to find. In this paper, we propose simplified, efficient methods of root cause analysis when the task is to identify a unique root cause instead of quantitative contribution analysis. Our proposed methods run in linear order of SCM nodes and they require only the causal DAG without counterfactuals. Furthermore, for those use cases where the causal DAG is unknown, we justify the heuristic of identifying root causes as the variables with the highest anomaly score. To this end, we prove that anomalies with small scores are unlikely to cause those with large scores and show upper bounds for the likelihood of causal pathways with non-monotonic anomaly scores.

arxiv情報

著者 Nastaran Okati,Sergio Hernan Garrido Mejia,William Roy Orchard,Patrick Blöbaum,Dominik Janzing
発行日 2024-11-06 14:09:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク