Text-Guided Variational Image Generation for Industrial Anomaly Detection and Segmentation

要約

工業生産における異常検出のためのクリーンなデータを取得するという課題に対処するために、テキストガイドによる変分画像生成方法を提案します。
私たちの手法では、広範なテキストライブラリ文書から学習した対象物体に関するテキスト情報を利用して、入力画像に似た良品データ画像を生成します。
提案されたフレームワークは、生成された欠陥のない画像がテキストおよび画像ベースの知識から得られる予想される分布と一致することを保証し、安定性と汎用性を保証します。
実験結果は、限られた良品データでも従来の手法を上回る、当社のアプローチの有効性を示しています。
私たちのアプローチは、4 つのベースライン モデルと 3 つの異なるデータセットにわたる一般化テストを通じて検証されています。
生成された画像を利用して異常検出モデルの有効性を高める追加の分析を紹介します。

要約(オリジナル)

We propose a text-guided variational image generation method to address the challenge of getting clean data for anomaly detection in industrial manufacturing. Our method utilizes text information about the target object, learned from extensive text library documents, to generate non-defective data images resembling the input image. The proposed framework ensures that the generated non-defective images align with anticipated distributions derived from textual and image-based knowledge, ensuring stability and generality. Experimental results demonstrate the effectiveness of our approach, surpassing previous methods even with limited non-defective data. Our approach is validated through generalization tests across four baseline models and three distinct datasets. We present an additional analysis to enhance the effectiveness of anomaly detection models by utilizing the generated images.

arxiv情報

著者 Mingyu Lee,Jongwon Choi
発行日 2024-03-26 14:42:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク