MAEDAY: MAE for few and zero shot AnomalY-Detection

要約

異常検出 (AD) の目標は、一連の正の (良い) 例のみが与えられた未知の分布から、異常値または範囲外の領域を特定することです。
Few-Shot AD (FSAD) は、最小限の通常の例で同じタスクを解決することを目的としています。
クエリの埋め込みベクトルを参照埋め込みのセットと比較する最近の埋め込みベースの方法は、FSAD の印象的な結果を示していますが、良い例は 1 つしか提供されていません。
画像再構成ベースの別のアプローチが歴史的に AD に使用されてきました。
アイデアは、モデルが分布外の画像に遭遇したときに領域を回復できないと仮定して、破損した観測から正常な画像を回復するようにモデルをトレーニングすることです。
ただし、適切に実行するには、さまざまな通常の画像のセットでトレーニングする必要があるため、画像再構成ベースの方法はローショット体制ではまだ使用されていませんでした。
マスク オート エンコーダー (MAE) を使用することをお勧めします。これは、FSAD の周囲に基づいて欠落した画像領域を回復するようにトレーニングされた自己教師付きトランスフォーマー モデルです。
MAE は、自然画像 (ImageNet) の任意のセットで事前トレーニングし、通常の画像の小さなセットでのみ微調整することでうまく機能することを示します。
このメソッドを MAEDAY と名付けます。
さらに、MAEDAY が埋め込みベースの方法に直交信号を提供し、2 つのアプローチのアンサンブルが非常に強力な SOTA 結果を達成することがわかります。
また、トレーニング時に通常のサンプルが利用できないゼロショット AD (ZSAD) の新しいタスクも提示します。
MAEDAY がこのタスクで驚くほどうまく機能することを示します。
最後に、地上の異物を検出するための新しいデータセットを提供し、このタスクでも優れた結果を示します。
コードは https://github.com/EliSchwartz/MAEDAY で入手できます。

要約(オリジナル)

The goal of Anomaly-Detection (AD) is to identify outliers, or outlying regions, from some unknown distribution given only a set of positive (good) examples. Few-Shot AD (FSAD) aims to solve the same task with a minimal amount of normal examples. Recent embedding-based methods, that compare the embedding vectors of queries to a set of reference embeddings, have demonstrated impressive results for FSAD, where as little as one good example is provided. A different approach, image-reconstruction-based, has been historically used for AD. The idea is to train a model to recover normal images from corrupted observations, assuming that the model will fail to recover regions when encountered with an out-of-distribution image. However, image-reconstruction-based methods were not yet used in the low-shot regime as they need to be trained on a diverse set of normal images in order to properly perform. We suggest using Masked Auto-Encoder (MAE), a self-supervised transformer model trained for recovering missing image regions based on their surroundings for FSAD. We show that MAE performs well by pre-training on an arbitrary set of natural images (ImageNet) and only fine-tuning on a small set of normal images. We name this method MAEDAY. We further find that MAEDAY provides an orthogonal signal to the embedding-based methods and the ensemble of the two approaches achieves very strong SOTA results. We also present a novel task of Zero-Shot AD (ZSAD) where no normal samples are available at training time. We show that MAEDAY performs surprisingly well at this task. Finally, we provide a new dataset for detecting foreign objects on the ground and demonstrate superior results for this task as well. Code is available at https://github.com/EliSchwartz/MAEDAY .

arxiv情報

著者 Eli Schwartz,Assaf Arbelle,Leonid Karlinsky,Sivan Harary,Florian Scheidegger,Sivan Doveh,Raja Giryes
発行日 2022-11-25 18:59:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク