Multivariate Time-Series Anomaly Detection with Contaminated Data

要約

主流の教師なし異常検出アルゴリズムは学術データセットでは優れていることが多いですが、クリーンなトレーニング データを含む制御された実験条件により、現実世界のパフォーマンスは制限されます。
実際の異常検出において一般的な問題である、ノイズを使用したトレーニングの課題への対処は、しばしば見落とされます。
先駆的な取り組みとして、この研究は、感覚時系列異常検出 (TSAD) 内のラベルレベルのノイズの領域を掘り下げています。
この論文では、トレーニング データが異常で汚染されている場合の、新規かつ実用的なエンドツーエンドの教師なし TSAD を紹介します。
導入されたアプローチは TSAD-C と呼ばれ、トレーニング段階では異常ラベルにアクセスできません。
TSAD-C には 3 つのモジュールが含まれています。トレーニング データに存在する異常 (別名ノイズ) を修正する除染器、除染されたデータ内の長期的な変数内および変数間の両方の依存関係をキャプチャする長距離変数依存性モデリング モジュールです。
純粋な正常データの代理として考慮され、あらゆるタイプの異常を検出するための異常スコアリング モジュールと見なされます。
3 つの信頼できるデータセットに対して行われた広範な実験により、私たちのアプローチが既存の方法論を超え、この分野で新たな最先端のパフォーマンスが確立されることが決定的に証明されました。

要約(オリジナル)

Mainstream unsupervised anomaly detection algorithms often excel in academic datasets, yet their real-world performance is restricted due to the controlled experimental conditions involving clean training data. Addressing the challenge of training with noise, a prevalent issue in practical anomaly detection, is frequently overlooked. In a pioneering endeavor, this study delves into the realm of label-level noise within sensory time-series anomaly detection (TSAD). This paper presents a novel and practical end-to-end unsupervised TSAD when the training data are contaminated with anomalies. The introduced approach, called TSAD-C, is devoid of access to abnormality labels during the training phase. TSAD-C encompasses three modules: a Decontaminator to rectify the abnormalities (aka noise) present in the training data, a Long-range Variable Dependency Modeling module to capture both long-term intra- and inter-variable dependencies within the decontaminated data that can be considered as a surrogate of the pure normal data, and an Anomaly Scoring module to detect anomalies from all types. Our extensive experiments conducted on three reliable datasets conclusively demonstrate that our approach surpasses existing methodologies, thus establishing a new state-of-the-art performance in the field.

arxiv情報

著者 Thi Kieu Khanh Ho,Narges Armanfard
発行日 2024-02-16 17:39:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, eess.SP パーマリンク