CAINNFlow: Convolutional block Attention modules and Invertible Neural Networks Flow for anomaly detection and localization tasks

要約

物体の異常の検出は産業プロセスにおいて重要ですが、多数の欠陥のあるサンプルを取得することは困難であり、実際の異常のタイプは予測できないため、教師なしの異常の検出と位置特定は特に重要です。
既存の教師なし異常検出およびローカリゼーション手法の中で、NF ベースのスキームはより良い結果を達成しています。
ただし、NF の 2 つのサブネット (複雑な関数) $s_{i}(u_{i})$ と $t_{i}(u_{i})$ は通常、多層パーセプトロンであり、入力視覚的特徴を
2D が 1D に平坦化され、フィーチャ マップの空間位置関係が破壊され、空間構造情報が失われます。
空間構造情報を保持して効果的に抽出するために、この研究では、積み重ねられた $3\times3$ フル畳み込みに埋め込まれた交互の CBAM を持つ複雑な関数モデルを設計します。これは、正規化されたフロー モデルで空間構造情報を保持して効果的に抽出することができます。
.
MVTec AD データセットに関する広範な実験結果は、CAINNFlow が特徴抽出器としての CNN および Transformer バックボーン ネットワークに基づいて、高度なレベルの精度と推論効率を達成し、CAINNFlow が MVTec AD の異常検出で $98.64\%$ のピクセル レベルの AUC を達成することを示しています。

要約(オリジナル)

Detection of object anomalies is crucial in industrial processes, but unsupervised anomaly detection and localization is particularly important due to the difficulty of obtaining a large number of defective samples and the unpredictable types of anomalies in real life. Among the existing unsupervised anomaly detection and localization methods, the NF-based scheme has achieved better results. However, the two subnets (complex functions) $s_{i}(u_{i})$ and $t_{i}(u_{i})$ in NF are usually multilayer perceptrons, which need to squeeze the input visual features from 2D flattening to 1D, destroying the spatial location relationship in the feature map and losing the spatial structure information. In order to retain and effectively extract spatial structure information, we design in this study a complex function model with alternating CBAM embedded in a stacked $3\times3$ full convolution, which is able to retain and effectively extract spatial structure information in the normalized flow model. Extensive experimental results on the MVTec AD dataset show that CAINNFlow achieves advanced levels of accuracy and inference efficiency based on CNN and Transformer backbone networks as feature extractors, and CAINNFlow achieves a pixel-level AUC of $98.64\%$ for anomaly detection in MVTec AD.

arxiv情報

著者 Ruiqing Yan,Fan Zhang,Mengyuan Huang,Wu Liu,Dongyu Hu,Jinfeng Li,Qiang Liu,Jinrong Jiang,Qianjin Guo,Linghan Zheng
発行日 2022-12-15 10:15:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク