RHA-Net: An Encoder-Decoder Network with Residual Blocks and Hybrid Attention Mechanisms for Pavement Crack Segmentation

要約

舗装表面データの取得と評価は、舗装状態の評価において重要な役割を果たします。
この論文では、RHA-Netと呼ばれる、自動舗装亀裂セグメンテーションのための効率的かつ効果的なエンドツーエンドネットワークを提案して、舗装亀裂セグメンテーションの精度を向上させます。
RHA-Netは、残余ブロック(ResBlocks)とハイブリッドアテンションブロックをエンコーダーデコーダーアーキテクチャに統合することによって構築されます。
ResBlocksは、高レベルの抽象的な特徴を抽出するRHA-Netの機能を向上させるために使用されます。
ハイブリッドアテンションブロックは、低レベルの機能と高レベルの機能の両方を融合して、モデルが正しいチャネルと亀裂の領域に焦点を合わせるのに役立つように設計されているため、RHA-Netの機能表示機能が向上します。
自己設計の移動ロボットによって収集された789の舗装亀裂画像を含む画像データセットが構築され、提案されたモデルのトレーニングと評価に使用されます。
他の最先端のネットワークと比較して、提案されたモデルはより良いパフォーマンスを達成し、残余ブロックとハイブリッド注意メカニズムを追加する機能は、包括的なアブレーション研究で検証されています。
さらに、深さ方向に分離可能な畳み込みを導入することによって生成されたモデルの軽量バージョンは、U-Netパラメーターの数の1/30で、より優れたパフォーマンスとはるかに高速な処理速度を実現します。
開発されたシステムは、組み込みデバイスJetson TX2(25 FPS)でリアルタイムに舗装亀裂をセグメント化できます。
リアルタイム実験で撮影されたビデオはhttps://youtu.be/3XIogk0fiG4で公開されています。

要約(オリジナル)

The acquisition and evaluation of pavement surface data play an essential role in pavement condition evaluation. In this paper, an efficient and effective end-to-end network for automatic pavement crack segmentation, called RHA-Net, is proposed to improve the pavement crack segmentation accuracy. The RHA-Net is built by integrating residual blocks (ResBlocks) and hybrid attention blocks into the encoder-decoder architecture. The ResBlocks are used to improve the ability of RHA-Net to extract high-level abstract features. The hybrid attention blocks are designed to fuse both low-level features and high-level features to help the model focus on correct channels and areas of cracks, thereby improving the feature presentation ability of RHA-Net. An image data set containing 789 pavement crack images collected by a self-designed mobile robot is constructed and used for training and evaluating the proposed model. Compared with other state-of-the-art networks, the proposed model achieves better performance and the functionalities of adding residual blocks and hybrid attention mechanisms are validated in a comprehensive ablation study. Additionally, a light-weighted version of the model generated by introducing depthwise separable convolution achieves better a performance and a much faster processing speed with 1/30 of the number of U-Net parameters. The developed system can segment pavement crack in real-time on an embedded device Jetson TX2 (25 FPS). The video taken in real-time experiments is released at https://youtu.be/3XIogk0fiG4.

arxiv情報

著者 Guijie Zhu,Zhun Fan,Jiacheng Liu,Duan Yuan,Peili Ma,Meihua Wang,Weihua Sheng,Kelvin C. P. Wang
発行日 2022-07-28 15:26:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク