A method to benchmark high-dimensional process drift detection


曲線下の側頭領域と呼ばれる評価スコアが導入され、機械学習モデルがドリフト セグメントに属する曲線をどの程度明らかにするかを定量化できます。
最後に、導入されたフレームワークで生成された合成データに対する一般的な機械学習アプローチを比較したベンチマーク研究が示され、既存のアルゴリズムが複数のドリフト セグメントを含むデータセットに苦戦することが多いことが示されています。


Process curves are multivariate finite time series data coming from manufacturing processes. This paper studies machine learning that detect drifts in process curve datasets. A theoretic framework to synthetically generate process curves in a controlled way is introduced in order to benchmark machine learning algorithms for process drift detection. An evaluation score, called the temporal area under the curve, is introduced, which allows to quantify how well machine learning models unveil curves belonging to drift segments. Finally, a benchmark study comparing popular machine learning approaches on synthetic data generated with the introduced framework is presented that shows that existing algorithms often struggle with datasets containing multiple drift segments.


著者 Edgar Wolf,Tobias Windisch
発行日 2024-12-05 18:56:04+00:00
arxivサイト arxiv_id(pdf)

カテゴリー: cs.AI, cs.LG, stat.ML パーマリンク