Drift Detection: Introducing Gaussian Split Detector

要約

最近の研究により、さまざまなドリフト検出器が生み出されました。
ただし、優れたパフォーマンスを達成するには、ドリフト検出フェーズ中に真のクラス ラベルが利用可能である必要があります。
この論文は、検出段階でグランド トゥルースが不明な場合のドリフトを検出することを目的としています。
そのために、バッチ モードで動作する新しいドリフト検出器であるガウス分割検出器 (GSD) を導入します。
GSD は、データが正規分布に従う場合に機能するように設計されており、ガウス混合モデルを利用して決定境界の変化を監視します。
このアルゴリズムは、多次元データ ストリームを処理し、推論フェーズ中にグラウンド トゥルース ラベルなしで機能するように設計されており、現実世界での使用に適しています。
実際のデータセットと合成データセットに関する大規模な実験研究で、当社の検出器を最先端技術と比較して評価しました。
私たちの検出器は、実際のドリフトを検出し、誤警報を回避する鍵となる仮想ドリフトを無視する点で最先端の検出器を上回っていることを示します。

要約(オリジナル)

Recent research yielded a wide array of drift detectors. However, in order to achieve remarkable performance, the true class labels must be available during the drift detection phase. This paper targets at detecting drift when the ground truth is unknown during the detection phase. To that end, we introduce Gaussian Split Detector (GSD) a novel drift detector that works in batch mode. GSD is designed to work when the data follow a normal distribution and makes use of Gaussian mixture models to monitor changes in the decision boundary. The algorithm is designed to handle multi-dimension data streams and to work without the ground truth labels during the inference phase making it pertinent for real world use. In an extensive experimental study on real and synthetic datasets, we evaluate our detector against the state of the art. We show that our detector outperforms the state of the art in detecting real drift and in ignoring virtual drift which is key to avoid false alarms.

arxiv情報

著者 Maxime Fuccellaro,Laurent Simon,Akka Zemmari
発行日 2024-05-14 14:15:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DC, cs.LG パーマリンク