Revisiting Deep Feature Reconstruction for Logical and Structural Industrial Anomaly Detection

要約

産業用異常検出は品質管理と予知保全にとって重要ですが、トレーニング データが限られていること、異常の種類が多様であること、物体の外観を変える外部要因により課題が生じます。
既存の方法は一般に、事前に訓練された深いネットワークを通じて抽出された画像パッチからのマルチスケール特徴を活用することで、へこみや傷などの構造異常を検出します。
ただし、多くのメモリと計算の需要により、実際の応用が制限されることがよくあります。
さらに、要素が欠落している、または過剰な画像などの論理的な異常を検出するには、従来のパッチベースの方法では捉えることができない空間的関係を理解する必要があります。
この研究では、構造異常を検出するためのメモリ効率と計算効率の高いアプローチである深層特徴再構成 (DFR) に焦点を当てることで、これらの制限に対処します。
私たちは DFR をさらに強化して、構造的異常と論理的異常の両方を検出できる ULSAD と呼ばれる統合フレームワークに組み込みます。
具体的には、構造異常検出のパフォーマンスを向上させるために DFR トレーニング目標を改良するとともに、論理異常検出を処理するためにグローバル オートエンコーダのようなネットワークを使用した注意ベースの損失メカニズムを導入します。
5 つのベンチマーク データセットにわたる当社の経験的評価では、構造的異常と論理的異常の両方を検出して位置特定する際の ULSAD のパフォーマンスが、8 つの最先端の手法を上回っていることが実証されました。
広範なアブレーション研究により、全体的なパフォーマンス向上に対する各コンポーネントの貢献がさらに強調されています。
私たちのコードは https://github.com/sukanyapatra1997/ULSAD-2024.git で入手できます。

要約(オリジナル)

Industrial anomaly detection is crucial for quality control and predictive maintenance, but it presents challenges due to limited training data, diverse anomaly types, and external factors that alter object appearances. Existing methods commonly detect structural anomalies, such as dents and scratches, by leveraging multi-scale features from image patches extracted through deep pre-trained networks. However, significant memory and computational demands often limit their practical application. Additionally, detecting logical anomalies-such as images with missing or excess elements-requires an understanding of spatial relationships that traditional patch-based methods fail to capture. In this work, we address these limitations by focusing on Deep Feature Reconstruction (DFR), a memory- and compute-efficient approach for detecting structural anomalies. We further enhance DFR into a unified framework, called ULSAD, which is capable of detecting both structural and logical anomalies. Specifically, we refine the DFR training objective to improve performance in structural anomaly detection, while introducing an attention-based loss mechanism using a global autoencoder-like network to handle logical anomaly detection. Our empirical evaluation across five benchmark datasets demonstrates the performance of ULSAD in detecting and localizing both structural and logical anomalies, outperforming eight state-of-the-art methods. An extensive ablation study further highlights the contribution of each component to the overall performance improvement. Our code is available at https://github.com/sukanyapatra1997/ULSAD-2024.git

arxiv情報

著者 Sukanya Patra,Souhaib Ben Taieb
発行日 2024-10-21 17:56:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク