要約
風力タービンブレード (WTB) 画像の正確なセグメンテーションは、自動損傷検出システムのパフォーマンスに直接影響するため、効果的な評価には非常に重要です。
大規模なユニバーサル ビジョン モデルの進歩にもかかわらず、これらのモデルは、WTB セグメンテーションなどのドメイン固有のタスクではパフォーマンスが低下することがよくあります。
これに対処するために、我々は画像セグメンテーション用に Intrinsic LoRA を拡張し、画像レベルと潜在空間の両方の拡張を統合する新しいデュアル空間拡張戦略を提案します。
画像空間の拡張は、画像ペア間の線形補間によって実現されますが、潜在空間の拡張は、ノイズベースの潜在確率モデルを導入することによって実現されます。
私たちのアプローチはセグメンテーションの精度を大幅に向上させ、WTB 画像セグメンテーションにおける現在の最先端の方法を上回ります。
要約(オリジナル)
Accurate segmentation of wind turbine blade (WTB) images is critical for effective assessments, as it directly influences the performance of automated damage detection systems. Despite advancements in large universal vision models, these models often underperform in domain-specific tasks like WTB segmentation. To address this, we extend Intrinsic LoRA for image segmentation, and propose a novel dual-space augmentation strategy that integrates both image-level and latent-space augmentations. The image-space augmentation is achieved through linear interpolation between image pairs, while the latent-space augmentation is accomplished by introducing a noise-based latent probabilistic model. Our approach significantly boosts segmentation accuracy, surpassing current state-of-the-art methods in WTB image segmentation.
arxiv情報
著者 | Shubh Singhal,Raül Pérez-Gonzalo,Andreas Espersen,Antonio Agudo |
発行日 | 2024-12-30 10:06:02+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google