Maximum Mean Discrepancy on Exponential Windows for Online Change Detection


変更の検出は、データ ストリームを分析する際に基本的に重要であり、予測メンテナンス、不正行為の検出、医療など、多くの応用例があります。
確率分布空間の (半) 計量である最大平均不一致 (MMD) は、カーネルが強化されたドメインに対して強力なノンパラメトリック 2 サンプル テストを提供します。
特に、MMD は穏やかな条件下で分布間の不一致を検出できます。
ただし、古典的な MMD 推定器は 2 次の実行時の複雑さの問題を抱えており、データ ストリーム内の変更検出に直接使用するのは非実用的です。
この記事では、MMD の利点と指数ウィンドウに基づく効率的な計算を組み合わせた、指数ウィンドウでの最大平均不一致 (MMDEW) と呼ばれる新しい変更検出アルゴリズムを提案します。
私たちは、MMDEW が多対数的な実行時間と対数的なメモリの複雑さを享受できることを証明し、ベンチマーク データ ストリームで最先端のパフォーマンスを上回ることを経験的に示します。


Detecting changes is of fundamental importance when analyzing data streams and has many applications, e.g., in predictive maintenance, fraud detection, or medicine. A principled approach to detect changes is to compare the distributions of observations within the stream to each other via hypothesis testing. Maximum mean discrepancy (MMD), a (semi-)metric on the space of probability distributions, provides powerful non-parametric two-sample tests on kernel-enriched domains. In particular, MMD is able to detect any disparity between distributions under mild conditions. However, classical MMD estimators suffer from a quadratic runtime complexity, which renders their direct use for change detection in data streams impractical. In this article, we propose a new change detection algorithm, called Maximum Mean Discrepancy on Exponential Windows (MMDEW), that combines the benefits of MMD with an efficient computation based on exponential windows. We prove that MMDEW enjoys polylogarithmic runtime and logarithmic memory complexity and show empirically that it outperforms the state of the art on benchmark data streams.


著者 Florian Kalinke,Marco Heyden,Georg Gntuni,Edouard Fouché,Klemens Böhm
発行日 2024-09-16 13:36:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.LG, H.1.1 パーマリンク