Photovoltaic Defect Image Generator with Boundary Alignment Smoothing Constraint for Domain Shift Mitigation

要約

太陽光発電(PV)細胞の正確な欠陥検出は、インテリジェントなPV製造システムの品質と効率を確保するために重要です。
ただし、豊富な欠陥データの希少性は、効果的なモデルトレーニングに大きな課題をもたらします。
既存の方法では、データセットを強化するための生成モデルを調査しましたが、不安定性、限られた多様性、およびドメインシフトに苦しむことがよくあります。
これらの問題に対処するために、安定した拡散(SD)に基づいた太陽光発電欠陥画像ジェネレーターであるPDIGを提案します。
PDIGは、大規模なデータセットから学んだ強力なプライアーを活用して、限られたデータの下で生成品質を向上させます。
具体的には、欠陥タイプとその外観の間のリレーショナル概念をキャプチャするために、テキスト条件付けされた事前に組み込まれたセマンティックコンセプトエンミング(SCE)モジュールを導入します。
ドメイン分布をさらに豊かにするために、産業欠陥特性をSDモデルに注入する軽量の注意を喚起する軽量の産業スタイルアダプター(LISA)を設計します。
推論では、テキストイメージのデュアルスペース制約(TIDSC)モジュールを提案し、位置の一貫性と空間的スムージングアラインメントを介して生成された画像の品質を実施します。
広範な実験は、PDIGが最新の方法と比較して優れたリアリズムと多様性を達成することを示しています。
具体的には、私たちのアプローチは、2番目に良い方法でフレシェットの開始距離(FID)を19.16ポイント改善し、下流の欠陥検出タスクのパフォーマンスを大幅に向上させます。

要約(オリジナル)

Accurate defect detection of photovoltaic (PV) cells is critical for ensuring quality and efficiency in intelligent PV manufacturing systems. However, the scarcity of rich defect data poses substantial challenges for effective model training. While existing methods have explored generative models to augment datasets, they often suffer from instability, limited diversity, and domain shifts. To address these issues, we propose PDIG, a Photovoltaic Defect Image Generator based on Stable Diffusion (SD). PDIG leverages the strong priors learned from large-scale datasets to enhance generation quality under limited data. Specifically, we introduce a Semantic Concept Embedding (SCE) module that incorporates text-conditioned priors to capture the relational concepts between defect types and their appearances. To further enrich the domain distribution, we design a Lightweight Industrial Style Adaptor (LISA), which injects industrial defect characteristics into the SD model through cross-disentangled attention. At inference, we propose a Text-Image Dual-Space Constraints (TIDSC) module, enforcing the quality of generated images via positional consistency and spatial smoothing alignment. Extensive experiments demonstrate that PDIG achieves superior realism and diversity compared to state-of-the-art methods. Specifically, our approach improves Frechet Inception Distance (FID) by 19.16 points over the second-best method and significantly enhances the performance of downstream defect detection tasks.

arxiv情報

著者 Dongying Li,Binyi Su,Hua Zhang,Yong Li,Haiyong Chen
発行日 2025-05-09 15:16:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク