要約
工業用コンクリート表面の亀裂のセグメンテーションは、通常、亀裂が細長く複雑な形態を示すため、困難な作業です。
従来のセグメンテーション手法では、このような亀裂を正確に特定するのが困難なことが多く、メンテナンスや修理のプロセスが非効率になってしまいます。
この論文では、CrossDiff というクロス条件付きエンコーダ/デコーダを備えた新しい拡散ベースのモデルを提案します。これは、亀裂セグメンテーション タスクに拡散確率モデルを初めて導入したものです。
具体的には、CrossDiff はクロスエンコーダとクロスデコーダを拡散モデルに統合し、十字型の拡散モデル構造を構成します。
クロス エンコーダーは亀裂の詳細を保持する機能を強化し、クロス デコーダーは亀裂の意味論的特徴を抽出するのに役立ちます。
その結果、CrossDiff は細い亀裂をより適切に処理できるようになります。
CFD、CrackTree200、DeepCrack、GAPs384、Rissbilder を含む 5 つの困難な亀裂データセットに対して広範な実験が行われました。
結果は、提案された CrossDiff モデルが優れたパフォーマンスを達成し、Dice スコアと IoU の両方の点で他の最先端の方法を 8.0% 上回っていることを示しています。
コードは間もなくオープンソースになる予定です。
要約(オリジナル)
Crack Segmentation in industrial concrete surfaces is a challenging task because cracks usually exhibit intricate morphology with slender appearances. Traditional segmentation methods often struggle to accurately locate such cracks, leading to inefficiencies in maintenance and repair processes. In this paper, we propose a novel diffusion-based model with a cross-conditional encoder-decoder, named CrossDiff, which is the first to introduce the diffusion probabilistic model for the crack segmentation task. Specifically, CrossDiff integrates a cross-encoder and a cross-decoder into the diffusion model to constitute a cross-shaped diffusion model structure. The cross-encoder enhances the ability to retain crack details and the cross-decoder helps extract the semantic features of cracks. As a result, CrossDiff can better handle slender cracks. Extensive experiments were conducted on five challenging crack datasets including CFD, CrackTree200, DeepCrack, GAPs384, and Rissbilder. The results demonstrate that the proposed CrossDiff model achieves impressive performance, outperforming other state-of-the-art methods by 8.0% in terms of both Dice score and IoU. The code will be open-source soon.
arxiv情報
著者 | Xianglong Shi,Yunhan Jiang,Xiaoheng Jiang,Mingling Xu,Yang Liu |
発行日 | 2025-01-22 13:13:41+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google