Learning Feature Inversion for Multi-class Anomaly Detection under General-purpose COCO-AD Benchmark

要約

異常検出 (AD) は、多くの場合、工業品質検査や医療病変検査のための異常領域の検出に焦点を当てています。
ただし、特定のシナリオのターゲットがあるため、AD のデータ規模は比較的小さく、オブジェクト検出やセマンティック セグメンテーションなどの古典的なビジョン タスクと比較して評価指標がまだ不十分です。
これらのギャップを埋めるために、この研究ではまず、COCO を AD フィールドに拡張することにより、大規模で汎用的な COCO-AD データセットを構築します。
これにより、この困難なベンチマークにおけるさまざまな手法の公正な評価と持続可能な開発が可能になります。
さらに、AU-ROC などの現在の指標は単純なデータセットではほぼ飽和状態に達しており、さまざまな手法を包括的に評価することができません。
セグメンテーション分野のメトリクスに触発されて、さらにいくつかのより実用的な閾値依存の AD 固有のメトリクス、つまり m$F_1$$^{.2}_{.8}$、mAcc$^{.2}_ を提案します。
{.8}$、mIoU$^{.2}_{.8}$、および mIoU-max。
GAN インバージョンの高品質な再構成機能を動機として、高品質の特徴再構成を実現するためのシンプルだがより強力な InvAD フレームワークを提案します。
私たちの手法は、単一の検出モデルのみが異なるクラスからの異常を検出するようにトレーニングされるマルチクラス教師なし設定の下で、一般的な MVTec AD、VisA、および新しく提案された COCO-AD データセットに対する再構成ベースの手法の有効性を向上させます。
広範なアブレーション実験により、当社の InvAD の各コンポーネントの有効性が実証されました。
完全なコードとモデルは https://github.com/zhangzjn/ader で入手できます。

要約(オリジナル)

Anomaly detection (AD) is often focused on detecting anomaly areas for industrial quality inspection and medical lesion examination. However, due to the specific scenario targets, the data scale for AD is relatively small, and evaluation metrics are still deficient compared to classic vision tasks, such as object detection and semantic segmentation. To fill these gaps, this work first constructs a large-scale and general-purpose COCO-AD dataset by extending COCO to the AD field. This enables fair evaluation and sustainable development for different methods on this challenging benchmark. Moreover, current metrics such as AU-ROC have nearly reached saturation on simple datasets, which prevents a comprehensive evaluation of different methods. Inspired by the metrics in the segmentation field, we further propose several more practical threshold-dependent AD-specific metrics, ie, m$F_1$$^{.2}_{.8}$, mAcc$^{.2}_{.8}$, mIoU$^{.2}_{.8}$, and mIoU-max. Motivated by GAN inversion’s high-quality reconstruction capability, we propose a simple but more powerful InvAD framework to achieve high-quality feature reconstruction. Our method improves the effectiveness of reconstruction-based methods on popular MVTec AD, VisA, and our newly proposed COCO-AD datasets under a multi-class unsupervised setting, where only a single detection model is trained to detect anomalies from different classes. Extensive ablation experiments have demonstrated the effectiveness of each component of our InvAD. Full codes and models are available at https://github.com/zhangzjn/ader.

arxiv情報

著者 Jiangning Zhang,Chengjie Wang,Xiangtai Li,Guanzhong Tian,Zhucun Xue,Yong Liu,Guansong Pang,Dacheng Tao
発行日 2024-04-16 17:38:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク