Grid-Based Continuous Normal Representation for Anomaly Detection

要約

教師なしの方法での異常検出は大幅に進歩しており、トレーニングには通常の画像のみが利用可能です。
最近のいくつかの方法は、入力と直接保存された正常な特徴 (または訓練された特徴と正常な画像) を比較し、記憶に基づいて異常を検出することを目的としています。
ただし、このようなメモリベースのアプローチは、最近隣メカニズムまたはアテンション メカニズムによって実装される離散特徴空間で動作し、それぞれ貧弱な一般化または入力と同じものを出力するアイデンティティ ショートカットの問題に悩まされます。
さらに、既存のメソッドの大部分は単一クラスの異常を検出するように設計されているため、複数のクラスのオブジェクトが存在する場合には満足のいくパフォーマンスが得られません。
上記のすべての課題に取り組むために、空間特徴を座標に変換し、連続グリッドにマッピングすることで可能になる、「連続」特徴空間内の正常特徴を表現するための新しい異常検出方法である GRAD を提案します。
さらに、異常検出に合わせたグリッドを慎重に設計し、ローカルとグローバルの両方の正常な特徴を表現し、それらを効果的に融合します。
私たちの広範な実験は、GRAD が正常な特徴を一般化し、アイデンティティのショートカットを軽減することに成功していることを示しています。さらに、GRAD は、高粒度のグローバル表現のおかげで、単一のモデルで多様なクラスを効果的に処理します。
MVTec AD データセットを使用した評価では、GRAD は、マルチクラスの統合異常検出のエラーを 65.0% 削減することで、以前の最先端の方法を大幅に上回りました。
プロジェクト ページは https://tae-mo.github.io/grad/ で利用できます。

要約(オリジナル)

There have been significant advancements in anomaly detection in an unsupervised manner, where only normal images are available for training. Several recent methods aim to detect anomalies based on a memory, comparing the input and the directly stored normal features (or trained features with normal images). However, such memory-based approaches operate on a discrete feature space implemented by the nearest neighbor or attention mechanism, suffering from poor generalization or an identity shortcut issue outputting the same as input, respectively. Furthermore, the majority of existing methods are designed to detect single-class anomalies, resulting in unsatisfactory performance when presented with multiple classes of objects. To tackle all of the above challenges, we propose GRAD, a novel anomaly detection method for representing normal features within a ‘continuous’ feature space, enabled by transforming spatial features into coordinates and mapping them to continuous grids. Furthermore, we carefully design the grids tailored for anomaly detection, representing both local and global normal features and fusing them effectively. Our extensive experiments demonstrate that GRAD successfully generalizes the normal features and mitigates the identity shortcut, furthermore, GRAD effectively handles diverse classes in a single model thanks to the high-granularity global representation. In an evaluation using the MVTec AD dataset, GRAD significantly outperforms the previous state-of-the-art method by reducing 65.0\% of the error for multi-class unified anomaly detection. The project page is available at https://tae-mo.github.io/grad/.

arxiv情報

著者 Joo Chan Lee,Taejune Kim,Eunbyung Park,Simon S. Woo,Jong Hwan Ko
発行日 2024-02-28 12:38:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク