Rethinking Lightweight Convolutional Neural Networks for Efficient and High-quality Pavement Crack Detection

要約

道路の亀裂をピクセル レベルで検出することは、高度道路交通システムにおいて常に困難な課題でした。
天候、光、およびその他の要因などの外部環境により、舗装の亀裂は、コントラストが低く、連続性が低く、長さと幅のサイズが異なることがよくあります。
ただし、既存の研究のほとんどは、さまざまな状況下でのデータのクラックにあまり注意を払っていません。
一方、深層畳み込みニューラル ネットワーク (DCNN) に基づく最近のアルゴリズムは、亀裂検出のための最先端モデルの開発を促進しています。
それにもかかわらず、彼らは通常、優れたパフォーマンスを得るために複雑なモデルに焦点を当てていますが、実際のアプリケーションでの検出効率は無視しています。
この記事では、最初の問題に対処するために、2 つの新しいデータベース (Rain365 と Sun520) を収集し、オープン ソース コミュニティのデータを強化しました。
2 番目の問題については、優れたパフォーマンスで検出効率を向上させる方法を再考し、CarNet と呼ばれる軽量のエンコーダ/デコーダ アーキテクチャを提案します。
具体的には、エンコーダー ネットワークに新しいオリーブ型の構造、軽量のマルチスケール ブロック、デコーダー ネットワークに新しいアップサンプリング方法を導入します。
多数の実験により、私たちのモデルは以前のモデルと比較して、検出性能と効率のバランスを改善できることが示されています。
特に、Sun520 データセットでは、当社の CarNet は ODS F スコアが 0.488 から 0.514 まで、最先端のパフォーマンスを大幅に向上させます。
一方、クラック検出用に特別に設計された最近の DCNN ベースのアルゴリズムよりも桁違いに速い検出速度 (毎秒 104 フレーム) でこれを行います。

要約(オリジナル)

Pixel-level road crack detection has always been a challenging task in intelligent transportation systems. Due to the external environments, such as weather, light, and other factors, pavement cracks often present low contrast, poor continuity, and different sizes in length and width. However, most of the existing studies pay less attention to crack data under different situations. Meanwhile, recent algorithms based on deep convolutional neural networks (DCNNs) have promoted the development of cutting-edge models for crack detection. Nevertheless, they usually focus on complex models for good performance, but ignore detection efficiency in practical applications. In this article, to address the first issue, we collected two new databases (i.e. Rain365 and Sun520) captured in rainy and sunny days respectively, which enrich the data of the open source community. For the second issue, we reconsider how to improve detection efficiency with excellent performance, and then propose our lightweight encoder-decoder architecture termed CarNet. Specifically, we introduce a novel olive-shaped structure for the encoder network, a light-weight multi-scale block and a new up-sampling method in the decoder network. Numerous experiments show that our model can better balance detection performance and efficiency compared with previous models. Especially, on the Sun520 dataset, our CarNet significantly advances the state-of-the-art performance with ODS F-score from 0.488 to 0.514. Meanwhile, it does so with an improved detection speed (104 frame per second) which is orders of magnitude faster than some recent DCNNs-based algorithms specially designed for crack detection.

arxiv情報

著者 Kai Li,Jie Yang,Siwei Ma,Bo Wang,Shanshe Wang,Yingjie Tian,Zhiquan Qi
発行日 2023-01-31 15:48:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク