A Dataset for Evaluating Online Anomaly Detection Approaches for Discrete Multivariate Time Series

要約

多変量時系列に対する異常検出アプローチのベンチマークは、高品質のデータセットが不足しているため困難です。
現在公開されているデータセットは小さすぎて多様性がなく、些細な異常が特徴であるため、この研究分野での目に見える進歩が妨げられています。
私たちは、その解決策を提案します。それは、多変量、動的、可変状態特性を含む自動車パワートレインの現実的な挙動を反映する、最先端のシミュレーション ツールによって生成される、多様かつ広範かつ重要なデータセットです。
教師なしと半教師ありの両方の異常検出設定、時系列生成と予測に対応するために、さまざまなバージョンのデータセットを利用可能にしています。トレーニングとテストのサブセットは、タスクに応じて汚染されたバージョンとクリーンなバージョンで提供されます。
また、決定論的オートエンコーダーと変分オートエンコーダー、およびノンパラメトリック アプローチに基づく少数のアプローチからのベースライン結果も提供します。
予想通り、ベースライン実験では、データセットの半教師ありバージョンでトレーニングされたアプローチが教師なしバージョンよりも優れたパフォーマンスを発揮することが示されており、汚染されたトレーニング データに対してより堅牢なアプローチの必要性が強調されています。

要約(オリジナル)

Benchmarking anomaly detection approaches for multivariate time series is challenging due to the lack of high-quality datasets. Current publicly available datasets are too small, not diverse and feature trivial anomalies, which hinders measurable progress in this research area. We propose a solution: a diverse, extensive, and non-trivial dataset generated via state-of-the-art simulation tools that reflects realistic behaviour of an automotive powertrain, including its multivariate, dynamic and variable-state properties. To cater for both unsupervised and semi-supervised anomaly detection settings, as well as time series generation and forecasting, we make different versions of the dataset available, where training and test subsets are offered in contaminated and clean versions, depending on the task. We also provide baseline results from a small selection of approaches based on deterministic and variational autoencoders, as well as a non-parametric approach. As expected, the baseline experimentation shows that the approaches trained on the semi-supervised version of the dataset outperform their unsupervised counterparts, highlighting a need for approaches more robust to contaminated training data.

arxiv情報

著者 Lucas Correia,Jan-Christoph Goos,Thomas Bäck,Anna V. Kononova
発行日 2024-11-25 14:24:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CE, cs.LG, cs.SY, eess.SY パーマリンク