PATH: A Discrete-sequence Dataset for Evaluating Online Unsupervised Anomaly Detection Approaches for Multivariate Time Series

要約

多変量時系列のベンチマーク異常検出アプローチは、高品質のデータセットが不足しているため、困難なタスクです。
現在公開されているデータセットは小さすぎ、多様ではなく、些細な異常を特徴としており、この研究分野での測定可能な進歩を妨げます。
ソリューションを提案します。多変量、動的、可変状態特性を含む自動車パワートレインの現実的な動作を反映する最先端のシミュレーションツールを介して生成される多様で、広範囲で、非些細なデータセットです。
さらに、データセットは離散シーケンスの問題を表しており、これは以前に推定されていた文献のソリューションによって承認されていないままです。
監視されていないおよび半監視された異常検出設定の両方に対応するために、および時系列の生成と予測の両方で、タスクに応じて、汚染されたクリーンバージョンでトレーニングとテストサブセットが提供されるデータセットのさまざまなバージョンを利用可能にします。
また、決定論的および変動自動エンコーダーに基づいた一連のアプローチのベースライン結果、およびノンパラメトリックアプローチも提供します。
予想通り、ベースライン実験は、データセットの半監視バージョンで訓練されたアプローチが、監視されていないカウンターパートを上回ることを示しており、汚染されたトレーニングデータに対してより堅牢なアプローチの必要性を強調しています。
さらに、結果は、使用されるしきい値が検出性能に大きな影響を与える可能性があるため、ラベル付きデータを必要とせずに適切なしきい値を見つけるために、より多くの作業を方法に投資する必要があることを示しています。

要約(オリジナル)

Benchmarking anomaly detection approaches for multivariate time series is a challenging task due to a lack of high-quality datasets. Current publicly available datasets are too small, not diverse and feature trivial anomalies, which hinders measurable progress in this research area. We propose a solution: a diverse, extensive, and non-trivial dataset generated via state-of-the-art simulation tools that reflects realistic behaviour of an automotive powertrain, including its multivariate, dynamic and variable-state properties. Additionally, our dataset represents a discrete-sequence problem, which remains unaddressed by previously-proposed solutions in literature. To cater for both unsupervised and semi-supervised anomaly detection settings, as well as time series generation and forecasting, we make different versions of the dataset available, where training and test subsets are offered in contaminated and clean versions, depending on the task. We also provide baseline results from a selection of approaches based on deterministic and variational autoencoders, as well as a non-parametric approach. As expected, the baseline experimentation shows that the approaches trained on the semi-supervised version of the dataset outperform their unsupervised counterparts, highlighting a need for approaches more robust to contaminated training data. Furthermore, results show that the threshold used can have a large influence on detection performance, hence more work needs to be invested in methods to find a suitable threshold without the need for labelled data.

arxiv情報

著者 Lucas Correia,Jan-Christoph Goos,Thomas Bäck,Anna V. Kononova
発行日 2025-04-08 15:26:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CE, cs.LG, cs.SY, eess.SY パーマリンク