要約
最近の畳み込みニューラルネットワーク(CNN)と変換器ベースの手法の進歩により、異常検出とローカライゼーションが改善されたが、小さな異常を正確にローカライズすることには課題が残る。CNNは長距離依存性を捉えることに限界がある一方、変換器アーキテクチャはしばしば計算オーバーヘッドに悩まされる。我々は、状態空間モデル(SSM)に基づく、マルチクラス異常検出とローカライゼーションのためのピラミッド走査戦略(PSS)を紹介する。本手法は、マルチスケール特徴抽出のために事前に訓練されたエンコーダと特徴レベルの合成異常発生器とPSSを統合することにより、複数のスケールできめ細かい詳細を捉える。MVTecベンチマークにおいて、マルチクラス異常局在化のAPが$+1%$改善し、AU-PROが$+1%$増加した。コードは https://github.com/iqbalmlpuniud/Pyramid Mambaで入手可能です。
要約(オリジナル)
Recent advances in convolutional neural networks (CNNs) and transformer-based methods have improved anomaly detection and localization, but challenges persist in precisely localizing small anomalies. While CNNs face limitations in capturing long-range dependencies, transformer architectures often suffer from substantial computational overheads. We introduce a state space model (SSM)-based Pyramidal Scanning Strategy (PSS) for multi-class anomaly detection and localization–a novel approach designed to address the challenge of small anomaly localization. Our method captures fine-grained details at multiple scales by integrating the PSS with a pre-trained encoder for multi-scale feature extraction and a feature-level synthetic anomaly generator. An improvement of $+1\%$ AP for multi-class anomaly localization and a +$1\%$ increase in AU-PRO on MVTec benchmark demonstrate our method’s superiority in precise anomaly localization across diverse industrial scenarios. The code is available at https://github.com/iqbalmlpuniud/Pyramid Mamba.
arxiv情報
著者 | Nasar Iqbal,Niki Martinel |
発行日 | 2025-04-04 13:33:59+00:00 |
arxivサイト | arxiv_id(pdf) |