AnomalyNCD: Towards Novel Anomaly Class Discovery in Industrial Scenarios

要約

産業シナリオでは、異常検出によって異常を特定することはできますが、分類することはできません。
その機能を完成させるために、私たちは産業異常の視覚的なクラスを自動的に発見して認識することを研究しています。
マルチクラス異常分類の観点から見ると、以前の方法は、凍結された事前トレーニング済みモデルによって表される異常をクラスタリングしますが、識別が不十分なために失敗することがよくあります。
Novel class Discovery (NCD) には、これに対処できる可能性があります。
ただし、ネットワーク学習の焦点を脅かす、目立たない意味的に弱い異常に悩まされています。
これらに対処するために、既存の異常検出方法と互換性のあるマルチクラス異常分類フレームワークである AnomalyNCD を導入します。
このフレームワークは、異常固有の特徴を学習し、自己監視型の方法で異常を分類します。
最初に、主要素二値化 (MEBin) と呼ばれる技術が最初に設計されます。これは、誤った検出による学習への影響を軽減するために、一次異常領域をマスクにセグメント化します。
その後、特徴の識別を改善するためにマスクに基づく対比表現学習を採用します。これにより、孤立した異常領域にネットワークの注意が集中し、再修正された擬似ラベルを通じて誤った入力の混乱が軽減されます。
最後に、推論中に領域レベルと画像レベルの両方で柔軟な分類を可能にするために、分類された異常領域に基づいて全体的な画像カテゴリを決定する領域結合戦略を開発します。
私たちの方法は、MVTec AD および MTD データセットに対する最先端の研究よりも優れています。
現在の手法と比較して、ゼロショット異常検出手法と組み合わせた AnomalyNCD は、MVTec AD で 10.8% $F_1$ ゲイン、8.8% NMI ゲイン、9.5% ARI ゲイン、12.8% $F_1$ ゲイン、5.7% NMI ゲインを達成します。
MTD では 10.8% の ARI ゲインが得られます。
ソース コードは https://github.com/HUST-SLOW/AnomalyNCD で入手できます。

要約(オリジナル)

In the industrial scenario, anomaly detection could locate but cannot classify anomalies. To complete their capability, we study to automatically discover and recognize visual classes of industrial anomalies. In terms of multi-class anomaly classification, previous methods cluster anomalies represented by frozen pre-trained models but often fail due to poor discrimination. Novel class discovery (NCD) has the potential to tackle this. However, it struggles with non-prominent and semantically weak anomalies that challenge network learning focus. To address these, we introduce AnomalyNCD, a multi-class anomaly classification framework compatible with existing anomaly detection methods. This framework learns anomaly-specific features and classifies anomalies in a self-supervised manner. Initially, a technique called Main Element Binarization (MEBin) is first designed, which segments primary anomaly regions into masks to alleviate the impact of incorrect detections on learning. Subsequently, we employ mask-guided contrastive representation learning to improve feature discrimination, which focuses network attention on isolated anomalous regions and reduces the confusion of erroneous inputs through re-corrected pseudo labels. Finally, to enable flexible classification at both region and image levels during inference, we develop a region merging strategy that determines the overall image category based on the classified anomaly regions. Our method outperforms the state-of-the-art works on the MVTec AD and MTD datasets. Compared with the current methods, AnomalyNCD combined with zero-shot anomaly detection method achieves a 10.8% $F_1$ gain, 8.8% NMI gain, and 9.5% ARI gain on MVTec AD, 12.8% $F_1$ gain, 5.7% NMI gain, and 10.8% ARI gain on MTD. The source code is available at https://github.com/HUST-SLOW/AnomalyNCD.

arxiv情報

著者 Ziming Huang,Xurui Li,Haotian Liu,Feng Xue,Yuzhe Wang,Yu Zhou
発行日 2024-10-18 11:07:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク