要約
視覚異常検出(AD)は、異常なデータサンプルの希少性のために重要な課題を提示します。
異常なサンプルを合成するために多数の作品が提案されていますが、これらの合成異常は、多くの場合、信頼性を欠いているか、広範なトレーニングデータを必要とし、現実世界のシナリオでの適用性を制限します。
この作業では、さまざまな拡散(SD)の画像生成能力を活用して、多様で現実的な目に見えない異常を生成する新しいフレームワークであるAnomaly Anything(Anomalyany)を提案します。
テスト時間中に単一の正常なサンプルを条件付けることにより、アノマリアニーは、テキストの説明を使用して任意のオブジェクトタイプの目に見えない異常を生成することができます。
アノマリアニー内では、注意誘導異常の最適化を提案して、硬い異常の概念を生成することにSDの注意を向けることを提案します。
さらに、生成品質をさらに向上させるために詳細な説明を組み込んだ迅速なガイド付き異常洗練を紹介します。
MVTEC ADおよびVisaデータセットでの広範な実験は、高品質の目に見えない異常とダウンストリーム広告パフォーマンスの向上におけるその有効性を生成する際の異常の能力を示しています。
要約(オリジナル)
Visual anomaly detection (AD) presents significant challenges due to the scarcity of anomalous data samples. While numerous works have been proposed to synthesize anomalous samples, these synthetic anomalies often lack authenticity or require extensive training data, limiting their applicability in real-world scenarios. In this work, we propose Anomaly Anything (AnomalyAny), a novel framework that leverages Stable Diffusion (SD)’s image generation capabilities to generate diverse and realistic unseen anomalies. By conditioning on a single normal sample during test time, AnomalyAny is able to generate unseen anomalies for arbitrary object types with text descriptions. Within AnomalyAny, we propose attention-guided anomaly optimization to direct SD attention on generating hard anomaly concepts. Additionally, we introduce prompt-guided anomaly refinement, incorporating detailed descriptions to further improve the generation quality. Extensive experiments on MVTec AD and VisA datasets demonstrate AnomalyAny’s ability in generating high-quality unseen anomalies and its effectiveness in enhancing downstream AD performance.
arxiv情報
著者 | Han Sun,Yunkang Cao,Hao Dong,Olga Fink |
発行日 | 2025-05-19 15:41:06+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google