A Novel Approach to Industrial Defect Generation through Blended Latent Diffusion Model with Online Adaptation

要約

産業用異常検出 (AD) の課題に効果的に対処するには、欠陥のあるサンプルを十分に供給する必要がありますが、産業上の状況では欠陥サンプルの不足によって制約が妨げられることがよくあります。
この論文では、欠陥のあるサンプルを増強し、それによって AD パフォーマンスを向上させるように設計された新しいアルゴリズムを紹介します。
提案された方法は、潜在空間内に欠陥サンプルを生成する拡散モデルを使用して、欠陥サンプル生成用にブレンドされた潜在拡散モデルを調整します。
「trimap」マスクとテキスト プロンプトによって制御される特徴編集プロセスにより、生成されたサンプルが調整されます。
画像生成推論プロセスは、自由拡散ステージ、編集拡散ステージ、オンライン デコーダ適応ステージの 3 つのステージで構成されます。
この洗練された推論戦略により、さまざまなパターンのバリエーションを持つ高品質の合成欠陥サンプルが生成され、拡張されたトレーニング セットに基づいて AD 精度が大幅に向上します。
具体的には、広く認知されている MVTec AD データセット上で、提案された方法は拡張データを使用して AD の最先端 (SOTA) パフォーマンスを AD メトリクス AP、IAP、および IAP90 に対して 1.5%、1.9%、および 3.1% 向上させます。
、 それぞれ。
この作業の実装コードは、GitHub リポジトリ https://github.com/GrandpaXun242/AdaBLDM.git にあります。

要約(オリジナル)

Effectively addressing the challenge of industrial Anomaly Detection (AD) necessitates an ample supply of defective samples, a constraint often hindered by their scarcity in industrial contexts. This paper introduces a novel algorithm designed to augment defective samples, thereby enhancing AD performance. The proposed method tailors the blended latent diffusion model for defect sample generation, employing a diffusion model to generate defective samples in the latent space. A feature editing process, controlled by a ‘trimap’ mask and text prompts, refines the generated samples. The image generation inference process is structured into three stages: a free diffusion stage, an editing diffusion stage, and an online decoder adaptation stage. This sophisticated inference strategy yields high-quality synthetic defective samples with diverse pattern variations, leading to significantly improved AD accuracies based on the augmented training set. Specifically, on the widely recognized MVTec AD dataset, the proposed method elevates the state-of-the-art (SOTA) performance of AD with augmented data by 1.5%, 1.9%, and 3.1% for AD metrics AP, IAP, and IAP90, respectively. The implementation code of this work can be found at the GitHub repository https://github.com/GrandpaXun242/AdaBLDM.git

arxiv情報

著者 Hanxi Li,Zhengxun Zhang,Hao Chen,Lin Wu,Bo Li,Deyin Liu,Mingwen Wang
発行日 2024-02-29 16:33:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.MM パーマリンク