要約
拡散モデルは、教師なしの異常検出タスクで優れたパフォーマンスを示しています。
拡散モデルは通常のデータのみでトレーニングされるため、特定のノイズが追加されたテスト画像の通常の対応物を再構築する傾向があります。
ただし、これらの方法ではすべての潜在的な異常が平等に扱われるため、2 つの主な問題が発生する可能性があります。
世界的な観点から見ると、さまざまな異常を含む画像を再構成する難易度は均一ではありません。
したがって、すべてのサンプルに同じ設定を利用するのではなく、画像コンテンツと拡散モデルから抽出された事前分布との間の差異を評価することによって、各サンプルの特定のノイズ除去ステップを予測することを提案します。
局所的に見ると、同じ画像であっても、異常領域の再構成は正常領域とは異なります。
理論的には、拡散モデルは通常、標準的なガウス分布に従って各ステップのノイズを予測します。
ただし、異常とその潜在的な正常な対応部分との違いにより、異常領域で予測されるノイズは必然的に標準ガウス分布から逸脱します。
この目的を達成するために、拡散モデルが標準ガウス分布の制限を突破することを促進するためにトレーニングに合成異常サンプルを導入することを提案します。また、推論中に空間適応特徴融合スキームが利用されます。
上記の修正により、教師なし異常検出のためのグローバルおよびローカル適応拡散モデル (GLAD と略称) を提案します。これにより、魅力的な柔軟性が導入され、可能な限り多くの正常な情報を保持しながら異常のない再構築が実現されます。
一般的に使用される 3 つの異常検出データセット (MVTec-AD、MPDD、VisA) と統合したプリント基板データセット (PCB-Bank) に対して広範な実験が実施され、提案された方法の有効性が示されています。
要約(オリジナル)
Diffusion models have shown superior performance on unsupervised anomaly detection tasks. Since trained with normal data only, diffusion models tend to reconstruct normal counterparts of test images with certain noises added. However, these methods treat all potential anomalies equally, which may cause two main problems. From the global perspective, the difficulty of reconstructing images with different anomalies is uneven. Therefore, instead of utilizing the same setting for all samples, we propose to predict a particular denoising step for each sample by evaluating the difference between image contents and the priors extracted from diffusion models. From the local perspective, reconstructing abnormal regions differs from normal areas even in the same image. Theoretically, the diffusion model predicts a noise for each step, typically following a standard Gaussian distribution. However, due to the difference between the anomaly and its potential normal counterpart, the predicted noise in abnormal regions will inevitably deviate from the standard Gaussian distribution. To this end, we propose introducing synthetic abnormal samples in training to encourage the diffusion models to break through the limitation of standard Gaussian distribution, and a spatial-adaptive feature fusion scheme is utilized during inference. With the above modifications, we propose a global and local adaptive diffusion model (abbreviated to GLAD) for unsupervised anomaly detection, which introduces appealing flexibility and achieves anomaly-free reconstruction while retaining as much normal information as possible. Extensive experiments are conducted on three commonly used anomaly detection datasets (MVTec-AD, MPDD, and VisA) and a printed circuit board dataset (PCB-Bank) we integrated, showing the effectiveness of the proposed method.
arxiv情報
著者 | Hang Yao,Ming Liu,Haolin Wang,Zhicun Yin,Zifei Yan,Xiaopeng Hong,Wangmeng Zuo |
発行日 | 2024-06-11 17:27:23+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google