CrackNex: a Few-shot Low-light Crack Segmentation Model Based on Retinex Theory for UAV Inspections


この論文では、Retinex 理論に基づいた反射率情報を利用してモデルが統一された照明不変表現を学習できるようにするフレームワークである CrackNex を提案することで、これらの課題に対処します。
さらに、非効率なトレーニング データの問題を解決するために少数ショット セグメンテーションを利用します。
CrackNex では、サポート プロトタイプと反射率プロトタイプの両方がサポート セットから抽出されます。
CrackNex は、複数のデータセットに対して SOTA メソッドよりも優れたパフォーマンスを発揮します。
さらに、低照度亀裂セグメンテーション用の最初のベンチマーク データセット LCSD も紹介します。
LCSD は、102 枚の十分に照明された亀裂画像と 41 枚の低照度亀裂画像で構成されます。
データセットとコードは で入手できます。


Routine visual inspections of concrete structures are imperative for upholding the safety and integrity of critical infrastructure. Such visual inspections sometimes happen under low-light conditions, e.g., checking for bridge health. Crack segmentation under such conditions is challenging due to the poor contrast between cracks and their surroundings. However, most deep learning methods are designed for well-illuminated crack images and hence their performance drops dramatically in low-light scenes. In addition, conventional approaches require many annotated low-light crack images which is time-consuming. In this paper, we address these challenges by proposing CrackNex, a framework that utilizes reflectance information based on Retinex Theory to help the model learn a unified illumination-invariant representation. Furthermore, we utilize few-shot segmentation to solve the inefficient training data problem. In CrackNex, both a support prototype and a reflectance prototype are extracted from the support set. Then, a prototype fusion module is designed to integrate the features from both prototypes. CrackNex outperforms the SOTA methods on multiple datasets. Additionally, we present the first benchmark dataset, LCSD, for low-light crack segmentation. LCSD consists of 102 well-illuminated crack images and 41 low-light crack images. The dataset and code are available at


著者 Zhen Yao,Jiawei Xu,Shuhang Hou,Mooi Choo Chuah
発行日 2024-03-05 15:52:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV パーマリンク