Beyond Sharing: Conflict-Aware Multivariate Time Series Anomaly Detection

要約

ソフトウェア アプリケーションとサービス システムの信頼性を確保するために、大規模な主要業績評価指標 (KPI) が多変量時系列データ (MTS) として監視されます。
MTS の異常を正確に検出することは、その後の障害除去にとって非常に重要です。
異常と手動ラベル付けの不足により、すべてのメトリクスの回帰目標/損失を含む全体的な目標/損失を最適化する、さまざまな自己監視型 MTS 異常検出 (AD) 手法の開発が行われました。
しかし、私たちの実証研究では、メトリクスの回帰目標間に矛盾が蔓延しており、MTS モデルがさまざまな損失に対処する原因となっていることが明らかになりました。
この重要な側面は検出パフォーマンスに大きな影響を与えますが、既存のアプローチでは見落とされてきました。
この問題に対処するために、マルチゲート専門家混合 (MMoE) の設計を模倣することで、競合を認識する多変量 KPI 異常検出アルゴリズムである CAD を導入します。
CAD は、メトリクス間のプロモーションを促進しながら潜在的な競合を軽減するために、各メトリクスに専用の構造を提供します。
徹底的な調査の結果、バニラ MMoE のパフォーマンスの低下は主に、MTS 定式化の入出力の不整合設定と、拡張的なタスクから生じる収束の問題に起因することがわかりました。
これらの課題に対処するために、私たちは、単純かつ効果的なタスク指向のメトリクス選択と p&s (パーソナライズおよび共有) ゲート メカニズムを提案します。これにより、CAD が最初の実用的なマルチタスク学習 (MTL) ベースの MTS AD モデルとして確立されます。
複数の公開データセットの評価により、CAD が 3 つの公開データセット全体で 0.943 の平均 F1 スコアを取得し、特に最先端の手法を上回るパフォーマンスを示していることが明らかになりました。
私たちのコードは https://github.com/dawnvince/MTS_CAD からアクセスできます。

要約(オリジナル)

Massive key performance indicators (KPIs) are monitored as multivariate time series data (MTS) to ensure the reliability of the software applications and service system. Accurately detecting the abnormality of MTS is very critical for subsequent fault elimination. The scarcity of anomalies and manual labeling has led to the development of various self-supervised MTS anomaly detection (AD) methods, which optimize an overall objective/loss encompassing all metrics’ regression objectives/losses. However, our empirical study uncovers the prevalence of conflicts among metrics’ regression objectives, causing MTS models to grapple with different losses. This critical aspect significantly impacts detection performance but has been overlooked in existing approaches. To address this problem, by mimicking the design of multi-gate mixture-of-experts (MMoE), we introduce CAD, a Conflict-aware multivariate KPI Anomaly Detection algorithm. CAD offers an exclusive structure for each metric to mitigate potential conflicts while fostering inter-metric promotions. Upon thorough investigation, we find that the poor performance of vanilla MMoE mainly comes from the input-output misalignment settings of MTS formulation and convergence issues arising from expansive tasks. To address these challenges, we propose a straightforward yet effective task-oriented metric selection and p&s (personalized and shared) gating mechanism, which establishes CAD as the first practicable multi-task learning (MTL) based MTS AD model. Evaluations on multiple public datasets reveal that CAD obtains an average F1-score of 0.943 across three public datasets, notably outperforming state-of-the-art methods. Our code is accessible at https://github.com/dawnvince/MTS_CAD.

arxiv情報

著者 Haotian Si,Changhua Pei,Zhihan Li,Yadong Zhao,Jingjing Li,Haiming Zhang,Zulong Diao,Jianhui Li,Gaogang Xie,Dan Pei
発行日 2023-08-25 09:01:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク