A method to benchmark high-dimensional process drift detection

要約

プロセス曲線は、製造プロセスから得られる多変量有限時系列データです。
この論文では、プロセス曲線データセットのドリフトを検出する機械学習を研究します。
プロセスドリフト検出のための機械学習アルゴリズムのベンチマークを行うために、制御された方法でプロセス曲線を合成的に生成する理論的フレームワークが導入されています。
曲線下の側頭領域と呼ばれる評価スコアが導入され、機械学習モデルがドリフト セグメントに属する曲線をどの程度明らかにするかを定量化できます。
最後に、導入されたフレームワークで生成された合成データに対する一般的な機械学習アプローチを比較したベンチマーク研究が示され、既存のアルゴリズムが複数のドリフト セグメントを含むデータセットに苦戦することが多いことが示されています。

要約(オリジナル)

Process curves are multivariate finite time series data coming from manufacturing processes. This paper studies machine learning that detect drifts in process curve datasets. A theoretic framework to synthetically generate process curves in a controlled way is introduced in order to benchmark machine learning algorithms for process drift detection. An evaluation score, called the temporal area under the curve, is introduced, which allows to quantify how well machine learning models unveil curves belonging to drift segments. Finally, a benchmark study comparing popular machine learning approaches on synthetic data generated with the introduced framework is presented that shows that existing algorithms often struggle with datasets containing multiple drift segments.

arxiv情報

著者 Edgar Wolf,Tobias Windisch
発行日 2024-12-05 18:56:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, stat.ML パーマリンク