Dimensionless Anomaly Detection on Multivariate Streams with Variance Norm and Path Signature

要約

本稿では、多変量ストリームに対する無次元異常検出手法を提案する。
私たちの方法はさまざまなストリーム チャネルの測定単位から独立しているため、無次元です。
まず分散ノルムを提案します。分散ノルムは、無限次元の特徴空間と特異な経験的共分散行列を厳密に処理するためのマハラノビス距離の一般化です。
次に、分散ノルムをパス署名 (ストリームのグローバルな特徴を提供する反復積分の無限の集合) と組み合わせて、(多変量) ストリームの異常検出方法である SigMahaKNN を提案します。
SigMahaKNN はストリームの再パラメータ化、ストリームの連結に対して不変であり、パス署名の切り捨てレベルに応じて段階的な識別力を持つことを示します。
当社は SigMahaKNN をオープンソース ソフトウェアとして実装し、広範な数値実験を実施し、言語分析、手書き分析、船の移動経路分析、単変量時間に至るまでのアプリケーションにおいて、孤立林や局所外れ値要因と比較して河川の異常検出が大幅に向上していることを示しています。
-シリーズ分析。

要約(オリジナル)

In this paper, we propose a dimensionless anomaly detection method for multivariate streams. Our method is independent of the unit of measurement for the different stream channels, therefore dimensionless. We first propose the variance norm, a generalisation of Mahalanobis distance to handle infinite-dimensional feature space and singular empirical covariance matrix rigorously. We then combine the variance norm with the path signature, an infinite collection of iterated integrals that provide global features of streams, to propose SigMahaKNN, a method for anomaly detection on (multivariate) streams. We show that SigMahaKNN is invariant to stream reparametrisation, stream concatenation and has a graded discrimination power depending on the truncation level of the path signature. We implement SigMahaKNN as an open-source software, and perform extensive numerical experiments, showing significantly improved anomaly detection on streams compared to isolation forest and local outlier factors in applications ranging from language analysis, hand-writing analysis, ship movement paths analysis and univariate time-series analysis.

arxiv情報

著者 Zhen Shao,Ryan Sze-Yin Chan,Thomas Cochrane,Peter Foster,Terry Lyons
発行日 2023-12-06 16:46:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク