Online Model-based Anomaly Detection in Multivariate Time Series: Taxonomy, Survey, Research Challenges and Future Directions

要約

時系列の異常検出は、開発、製造、動的システムを含むその他の運用などのエンジニアリング プロセスにおいて重要な役割を果たします。
最先端のアプローチは、高次元データなどを扱う場合に役立つ可能性があるため、これらのプロセスはこの分野の進歩から大きな恩恵を受けることができます。
読者に用語の理解を提供するために、この調査では、オンラインとオフライン、トレーニングと推論を区別する新しい分類法を導入しています。
さらに、文献で使用されている最も一般的なデータセットと評価指標、および詳細な分析を示します。
さらに、この調査では、多変量時系列データに対する最先端のモデルベースのオンライン半教師なし異常検出アプローチの広範な概要を提供し、それらをさまざまなモデルファミリーやその他のプロパティに分類しています。
現在、さまざまなアプローチを相互に比較する信頼できる方法がないため、研究における最大の課題はベンチマークを中心に展開されています。
この問題には 2 つの側面があります。一方で、公開データセットには少なくとも 1 つの根本的な欠陥があり、他方では、現場における直感的で代表的な評価指標が欠如しています。
さらに、ほとんどの出版物が検出しきい値を選択する方法は現実世界の条件を無視しているため、現実世界への適用が妨げられています。
この分野で目に見える進歩を可能にするためには、今後の作業でこれらの問題に対処する必要があります。

要約(オリジナル)

Time-series anomaly detection plays an important role in engineering processes, like development, manufacturing and other operations involving dynamic systems. These processes can greatly benefit from advances in the field, as state-of-the-art approaches may aid in cases involving, for example, highly dimensional data. To provide the reader with understanding of the terminology, this survey introduces a novel taxonomy where a distinction between online and offline, and training and inference is made. Additionally, it presents the most popular data sets and evaluation metrics used in the literature, as well as a detailed analysis. Furthermore, this survey provides an extensive overview of the state-of-the-art model-based online semi- and unsupervised anomaly detection approaches for multivariate time-series data, categorising them into different model families and other properties. The biggest research challenge revolves around benchmarking, as currently there is no reliable way to compare different approaches against one another. This problem is two-fold: on the one hand, public data sets suffers from at least one fundamental flaw, while on the other hand, there is a lack of intuitive and representative evaluation metrics in the field. Moreover, the way most publications choose a detection threshold disregards real-world conditions, which hinders the application in the real world. To allow for tangible advances in the field, these issues must be addressed in future work.

arxiv情報

著者 Lucas Correia,Jan-Christoph Goos,Philipp Klein,Thomas Bäck,Anna V. Kononova
発行日 2024-08-09 08:10:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.SY, eess.SY パーマリンク