EfficientCrackNet: A Lightweight Model for Crack Segmentation

要約

特に舗装画像からのひび割れ検出は、強度の不均一性、複雑なトポロジー、低コントラスト、ノイズの多い背景などのいくつかの固有の複雑さのため、コンピューター ビジョンの分野で手強い課題を抱えています。
自動亀裂検出は、建物、舗装、橋などの重要なインフラの構造的完全性を維持するために非常に重要です。
既存の軽量手法は、計算の非効率性、複雑な亀裂パターン、困難な背景などの課題に直面することが多く、検出が不正確になり、現実世界のアプリケーションでは非実用的になります。
これらの制限に対処するために、畳み込みニューラル ネットワーク (CNN) と正確な亀裂セグメント化のためのトランスフォーマーを組み合わせた軽量ハイブリッド モデルである EfficientCrackNet を提案します。
EfficientCrackNet は、深さ方向分離可能畳み込み (DSC) レイヤーと MobileViT ブロックを統合して、グローバルとローカルの両方の特徴をキャプチャします。
このモデルは、事前トレーニングなしで効率的に亀裂エッジを検出するためのエッジ抽出法 (EEM) と、特徴抽出を強化するための超軽量サブスペース アテンション モジュール (ULSAM) を採用しています。
3 つのベンチマーク データセット Crack500、DeepCrack、GAPs384 での広範な実験により、EfficientCrackNet が既存の軽量モデルと比較して優れたパフォーマンスを達成しながら、必要なパラメーターは 0.26M のみ、FLOP は 0.483 FLOP (G) であることが実証されました。
提案されたモデルは、精度と計算効率の間の最適なバランスを提供し、最先端の軽量モデルを上回って、現実世界の亀裂セグメンテーションのための堅牢で適応性のあるソリューションを提供します。

要約(オリジナル)

Crack detection, particularly from pavement images, presents a formidable challenge in the domain of computer vision due to several inherent complexities such as intensity inhomogeneity, intricate topologies, low contrast, and noisy backgrounds. Automated crack detection is crucial for maintaining the structural integrity of essential infrastructures, including buildings, pavements, and bridges. Existing lightweight methods often face challenges including computational inefficiency, complex crack patterns, and difficult backgrounds, leading to inaccurate detection and impracticality for real-world applications. To address these limitations, we propose EfficientCrackNet, a lightweight hybrid model combining Convolutional Neural Networks (CNNs) and transformers for precise crack segmentation. EfficientCrackNet integrates depthwise separable convolutions (DSC) layers and MobileViT block to capture both global and local features. The model employs an Edge Extraction Method (EEM) and for efficient crack edge detection without pretraining, and Ultra-Lightweight Subspace Attention Module (ULSAM) to enhance feature extraction. Extensive experiments on three benchmark datasets Crack500, DeepCrack, and GAPs384 demonstrate that EfficientCrackNet achieves superior performance compared to existing lightweight models, while requiring only 0.26M parameters, and 0.483 FLOPs (G). The proposed model offers an optimal balance between accuracy and computational efficiency, outperforming state-of-the-art lightweight models, and providing a robust and adaptable solution for real-world crack segmentation.

arxiv情報

著者 Abid Hasan Zim,Aquib Iqbal,Zaid Al-Huda,Asad Malik,Minoru Kuribayash
発行日 2024-09-26 17:44:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク