要約
主流の監視なしの異常検出アルゴリズムは、しばしば学術データセットで優れていますが、クリーントレーニングデータを含む制御された実験条件により、実際のパフォーマンスが制限されています。
実際の異常検出における一般的な問題であるノイズによるトレーニングの課題に対処することは、しばしば見落とされます。
先駆的な努力では、この研究は、感覚の時系列異常検出(TSAD)内のラベルレベルのノイズの領域を掘り下げています。
このペーパーでは、トレーニングデータが異常で汚染されている場合、斬新で実用的なエンドツーエンドの監視されていないTSADを紹介します。
TSAD-Cと呼ばれる導入されたアプローチには、トレーニングフェーズ中に異常ラベルへのアクセスがありません。
TSAD-Cには、3つのコアモジュールが含まれます。トレーニング中に存在する異常(別名ノイズ)を是正するための脱染色剤、長期変数依存モデリングモジュールであり、純粋なデータからの提出と見なされる除染されたデータ内の長期的な変数および相互依存性依存関係をキャプチャし、アノマーを検出する態度スケーリングの装飾を検出します。
4つの信頼性が高く多様なデータセットで実施された広範な実験は、TSAD-Cが既存の方法論を上回り、TSAD分野で新しい最先端を確立することを決定的に実証しています。
要約(オリジナル)
Mainstream unsupervised anomaly detection algorithms often excel in academic datasets, yet their real-world performance is restricted due to the controlled experimental conditions involving clean training data. Addressing the challenge of training with noise, a prevalent issue in practical anomaly detection, is frequently overlooked. In a pioneering endeavor, this study delves into the realm of label-level noise within sensory time-series anomaly detection (TSAD). This paper presents a novel and practical end-to-end unsupervised TSAD when the training data is contaminated with anomalies. The introduced approach, called TSAD-C, is devoid of access to abnormality labels during the training phase. TSAD-C encompasses three core modules: a Decontaminator to rectify anomalies (aka noise) present during training, a Long-range Variable Dependency Modeling module to capture long-term intra- and inter-variable dependencies within the decontaminated data that is considered as a surrogate of the pure normal data, and an Anomaly Scoring module to detect anomalies from all types. Our extensive experiments conducted on four reliable and diverse datasets conclusively demonstrate that TSAD-C surpasses existing methodologies, thus establishing a new state-of-the-art in the TSAD field.
arxiv情報
著者 | Thi Kieu Khanh Ho,Narges Armanfard |
発行日 | 2025-05-07 16:56:51+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google