On the Fly Detection of Root Causes from Observed Data with Application to IT Systems

要約

この論文では、しきい値ベースの IT システムを表すために調整された新しい構造的因果モデルを紹介し、そのようなシステムにおける異常の根本原因を迅速に検出するように設計された新しいアルゴリズムを紹介します。
根本原因に因果関係がない場合、その方法は正しいことが証明されます。
一方、この仮定を緩和するためにエージェントの介入に基づいて延長が提案されています。
当社のアルゴリズムとそのエージェントベースの拡張機能は、オフライン データからの因果関係の発見を活用し、オンライン データで新たな異常が発生したときにサブグラフの走査を行います。
当社の広範な実験により、代替構造因果モデルや実際の IT 監視データから生成されたデータに適用した場合でも、当社の手法の優れたパフォーマンスが実証されています。

要約(オリジナル)

This paper introduces a new structural causal model tailored for representing threshold-based IT systems and presents a new algorithm designed to rapidly detect root causes of anomalies in such systems. When root causes are not causally related, the method is proven to be correct; while an extension is proposed based on the intervention of an agent to relax this assumption. Our algorithm and its agent-based extension leverage causal discovery from offline data and engage in subgraph traversal when encountering new anomalies in online data. Our extensive experiments demonstrate the superior performance of our methods, even when applied to data generated from alternative structural causal models or real IT monitoring data.

arxiv情報

著者 Lei Zan,Charles K. Assaad,Emilie Devijver,Eric Gaussier
発行日 2024-02-09 16:10:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク