Reproduction of scan B-statistic for kernel change-point detection algorithm

要約

変化点検出は、伝染病の発生、ソーシャルネットワークの進化、画像分析、無線通信など、幅広い応用範囲があるため、大きな注目を集めています。
新しいデータ サンプルが次々に到着するオンライン環境では、これらのサンプルが異なる分布からのものであるかどうかを継続的にテストすることが重要です。
理想的には、実際のアプリケーションでの堅牢性を確保するために、検出アルゴリズムは配布フリーである必要があります。
この論文では、効率的なカーネルベースのスキャン B 統計に基づいて最近提案されたオンライン変化点検出アルゴリズムを再現し、そのパフォーマンスを一般的に使用される 2 つのパラメトリック統計と比較します。
私たちの数値実験は、スキャン B 統計が一貫して優れたパフォーマンスを提供することを示しています。
より困難なシナリオでは、パラメトリック手法では変更を検出できない可能性がありますが、スキャン B 統計では適切なタイミングで変更を特定できます。
さらに、サブサンプリング技術の使用により、元のアルゴリズムに若干の改善がもたらされます。

要約(オリジナル)

Change-point detection has garnered significant attention due to its broad range of applications, including epidemic disease outbreaks, social network evolution, image analysis, and wireless communications. In an online setting, where new data samples arrive sequentially, it is crucial to continuously test whether these samples originate from a different distribution. Ideally, the detection algorithm should be distribution-free to ensure robustness in real-world applications. In this paper, we reproduce a recently proposed online change-point detection algorithm based on an efficient kernel-based scan B-statistic, and compare its performance with two commonly used parametric statistics. Our numerical experiments demonstrate that the scan B-statistic consistently delivers superior performance. In more challenging scenarios, parametric methods may fail to detect changes, whereas the scan B-statistic successfully identifies them in a timely manner. Additionally, the use of subsampling techniques offers a modest improvement to the original algorithm.

arxiv情報

著者 Zihan Wang
発行日 2024-08-23 15:12:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク