要約
この論文では、バックボーン畳み込みニューラル ネットワーク (CNN) から抽出された特徴ベクトルに単一の多変量ガウス (MVG) 分布をフィッティングする、画像内の異常検出のための PaDiM (インスタンス モデリングによるピクセル単位の異常検出) 手法の簡略化されたバリエーションを紹介します。
マハラノビス距離を異常スコアとして使用します。
特徴ベクトルに白色化変換を適用することで、このフレームワークに中間ステップを導入します。これにより、MVG によって学習された特徴を視覚的に説明できるヒートマップの生成が可能になります。
提案された手法は MVTec-AD データセットで評価され、その結果は視覚的なモデル検証の重要性を示し、他の方法では見えなかったこのフレームワークの問題についての洞察を提供します。
この論文用に生成された視覚化は、https://doi.org/10.5281/zenodo.7937978 で公開されています。
要約(オリジナル)
This paper introduces a simplified variation of the PaDiM (Pixel-Wise Anomaly Detection through Instance Modeling) method for anomaly detection in images, fitting a single multivariate Gaussian (MVG) distribution to the feature vectors extracted from a backbone convolutional neural network (CNN) and using their Mahalanobis distance as the anomaly score. We introduce an intermediate step in this framework by applying a whitening transformation to the feature vectors, which enables the generation of heatmaps capable of visually explaining the features learned by the MVG. The proposed technique is evaluated on the MVTec-AD dataset, and the results show the importance of visual model validation, providing insights into issues in this framework that were otherwise invisible. The visualizations generated for this paper are publicly available at https://doi.org/10.5281/zenodo.7937978.
arxiv情報
著者 | Joao P C Bertoldo,David Arrustico |
発行日 | 2023-07-12 10:12:57+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google