Change Detection in Multivariate data streams: Online Analysis with Kernel-QuantTree

要約

我々は、Kernel-QuantTree (KQT) ヒストグラムと EWMA 統計を組み合わせて多変量データ ストリームをオンラインで監視するノンパラメトリック変化検出アルゴリズムである Kernel-QuantTree Exponentially Weighted Moving Average (KQT-EWMA) を紹介します。
ヒストグラムを使用して任意の定常分布をモデル化できるため、結果として得られるモニタリング スキームは非常に柔軟であり、テスト統計の分布が定常条件におけるデータストリームの分布に依存しないため実用的です (ノンパラメトリック モニタリング)。
KQT-EWMA は、事前に決定された平均実行長 ($ARL_0$) で動作することにより、誤警報を制御できます。これにより、誤警報がトリガーされる前に監視される予想される定常サンプルの数が測定されます。
後者の特徴は、ほとんどのノンパラメトリック変化検出テストとは対照的であり、$ARL_0$ を事前に制御できることはほとんどありません。
合成データセットと現実世界のデータセットに関する実験では、KQT-EWMA が、同じ条件で機能するように設計された最先端の方法と同等かそれ以下の検出遅延を達成しながら、$ARL_0$ を制御できることが実証されました。

要約(オリジナル)

We present Kernel-QuantTree Exponentially Weighted Moving Average (KQT-EWMA), a non-parametric change-detection algorithm that combines the Kernel-QuantTree (KQT) histogram and the EWMA statistic to monitor multivariate data streams online. The resulting monitoring scheme is very flexible, since histograms can be used to model any stationary distribution, and practical, since the distribution of test statistics does not depend on the distribution of datastream in stationary conditions (non-parametric monitoring). KQT-EWMA enables controlling false alarms by operating at a pre-determined Average Run Length ($ARL_0$), which measures the expected number of stationary samples to be monitored before triggering a false alarm. The latter peculiarity is in contrast with most non-parametric change-detection tests, which rarely can control the $ARL_0$ a priori. Our experiments on synthetic and real-world datasets demonstrate that KQT-EWMA can control $ARL_0$ while achieving detection delays comparable to or lower than state-of-the-art methods designed to work in the same conditions.

arxiv情報

著者 Michelangelo Olmo Nogara Notarianni,Filippo Leveni,Diego Stucchi,Luca Frittoli,Giacomo Boracchi
発行日 2024-10-17 17:17:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク