Coincident Learning for Unsupervised Anomaly Detection


異常検出は複雑なシステム (産業施設、製造、大規模な科学実験など) にとって重要なタスクであり、サブシステムの障害は歩留まりの低下、製品の欠陥、さらにはコンポーネントの損傷につながる可能性があります。
複雑なシステムには豊富なデータが存在することがよくありますが、ラベル付きの異常は通常はまれであり (あるいは存在しないことさえあり)、取得に費用がかかります。
したがって、教師なしアプローチが一般的であり、通常は入力特徴空間 (または関連する低次元表現) 内のサンプルの距離または密度によって異常を検索します。
この論文では、CoAD と呼ばれる新しいアプローチを紹介します。これは特にマルチモーダル タスク向けに設計されており、特徴空間の 2 つの異なるスライスにわたる \textit{coincident} の動作に基づいて異常を特定します。
教師あり分類 $F_\beta$ 統計と同様に、 \textit{教師なし} 指標 $\hat{F}_\beta$ を定義します。
CoAD は、$\hat{F}_\beta$ を使用して、1 つの特徴スライスの異常な動作が他の特徴スライスの異常な動作と一致するという期待に基づいて、\textit{unlabeled data} に対する異常検出アルゴリズムをトレーニングします。
この方法は、合成外れ値データ セットと MNIST ベースの画像データ セットを使用して説明されており、金属フライス加工データ セットと粒子からのデータ セットという 2 つの現実世界のタスクに関する従来の最先端技術と比較されています。


Anomaly detection is an important task for complex systems (e.g., industrial facilities, manufacturing, large-scale science experiments), where failures in a sub-system can lead to low yield, faulty products, or even damage to components. While complex systems often have a wealth of data, labeled anomalies are typically rare (or even nonexistent) and expensive to acquire. Unsupervised approaches are therefore common and typically search for anomalies either by distance or density of examples in the input feature space (or some associated low-dimensional representation). This paper presents a novel approach called CoAD, which is specifically designed for multi-modal tasks and identifies anomalies based on \textit{coincident} behavior across two different slices of the feature space. We define an \textit{unsupervised} metric, $\hat{F}_\beta$, out of analogy to the supervised classification $F_\beta$ statistic. CoAD uses $\hat{F}_\beta$ to train an anomaly detection algorithm on \textit{unlabeled data}, based on the expectation that anomalous behavior in one feature slice is coincident with anomalous behavior in the other. The method is illustrated using a synthetic outlier data set and a MNIST-based image data set, and is compared to prior state-of-the-art on two real-world tasks: a metal milling data set and a data set from a particle accelerator.


著者 Ryan Humble,Zhe Zhang,Finn O’Shea,Eric Darve,Daniel Ratner
発行日 2023-09-05 16:04:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.LG パーマリンク