要約
このホワイトペーパーでは、トレーニング時にカテゴリごとに限られた数の正常な画像のみが提供される、異常検出(AD)の実用的でありながら十分に研究されていない設定である、数ショットの異常検出(FSAD)について検討します。
これまでのところ、既存のFSAD研究は、標準ADに使用されるカテゴリごとの1つのモデルの学習パラダイムに従っており、カテゴリ間の共通性は調査されていません。
人間が異常を検出する方法、つまり問題の画像を通常の画像と比較する方法に触発されて、ここでは、プロキシタスクとして、カテゴリ間で本質的に一般化できる画像位置合わせタスクである登録を活用して、カテゴリに依存しない異常検出モデルをトレーニングします。
テスト中、異常は、テスト画像の登録された特徴とそれに対応するサポート(通常の)画像を比較することによって識別されます。
私たちが知る限り、これは単一の一般化可能なモデルをトレーニングする最初のFSADメソッドであり、新しいカテゴリの再トレーニングやパラメーターの微調整を必要としません。
実験結果は、提案された方法が、MVTecおよびMPDDベンチマークでAUCにおいて最先端のFSAD方法を3%〜8%上回っていることを示しています。
要約(オリジナル)
This paper considers few-shot anomaly detection (FSAD), a practical yet under-studied setting for anomaly detection (AD), where only a limited number of normal images are provided for each category at training. So far, existing FSAD studies follow the one-model-per-category learning paradigm used for standard AD, and the inter-category commonality has not been explored. Inspired by how humans detect anomalies, i.e., comparing an image in question to normal images, we here leverage registration, an image alignment task that is inherently generalizable across categories, as the proxy task, to train a category-agnostic anomaly detection model. During testing, the anomalies are identified by comparing the registered features of the test image and its corresponding support (normal) images. As far as we know, this is the first FSAD method that trains a single generalizable model and requires no re-training or parameter fine-tuning for new categories. Experimental results have shown that the proposed method outperforms the state-of-the-art FSAD methods by 3%-8% in AUC on the MVTec and MPDD benchmarks.
arxiv情報
著者 | Chaoqin Huang,Haoyan Guan,Aofan Jiang,Ya Zhang,Michael Spratling,Yan-Feng Wang |
発行日 | 2022-07-15 09:20:13+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google