Imbalance-Aware Culvert-Sewer Defect Segmentation Using an Enhanced Feature Pyramid Network

要約

不均衡なデータセットは、現実世界のシナリオでは重大な課題です。
これらは、過小評価されたクラスでモデルのパフォーマンスが低下することにつながり、これはインフラストラクチャ検査における重要な問題です。
このペーパーでは、不均衡なデータセット内の暗渠と下水道管のセマンティック セグメンテーションのための深層学習モデルである拡張機能ピラミッド ネットワーク (E-FPN) を紹介します。
E-FPN には、まばらに接続されたブロックや深さ方向の分離可能な畳み込みなどのアーキテクチャ上の革新が組み込まれており、特徴抽出を改善し、オブジェクトのバリエーションを処理します。
データセットの不均衡に対処するために、モデルではクラス分解やデータ拡張などの戦略が採用されています。
暗渠下水道欠陥データセットとベンチマークの空中セマンティック セグメンテーション ドローン データセットの実験結果では、E-FPN が最先端の手法を上回り、Intersection over Union (IoU) の平均 13.8% と 27.2% の改善を達成したことが示されています。
それぞれ。
さらに、クラス分解とデータ拡張を組み合わせると、モデルのパフォーマンスが IoU 約 6.9% 向上します。
提案された E-FPN は、困難なマルチクラス現実世界のデータセットにおけるオブジェクトのセグメンテーションを強化するための有望なソリューションを提供し、潜在的なアプリケーションは暗渠下水道の欠陥検出を超えて拡張されます。

要約(オリジナル)

Imbalanced datasets are a significant challenge in real-world scenarios. They lead to models that underperform on underrepresented classes, which is a critical issue in infrastructure inspection. This paper introduces the Enhanced Feature Pyramid Network (E-FPN), a deep learning model for the semantic segmentation of culverts and sewer pipes within imbalanced datasets. The E-FPN incorporates architectural innovations like sparsely connected blocks and depth-wise separable convolutions to improve feature extraction and handle object variations. To address dataset imbalance, the model employs strategies like class decomposition and data augmentation. Experimental results on the culvert-sewer defects dataset and a benchmark aerial semantic segmentation drone dataset show that the E-FPN outperforms state-of-the-art methods, achieving an average Intersection over Union (IoU) improvement of 13.8% and 27.2%, respectively. Additionally, class decomposition and data augmentation together boost the model’s performance by approximately 6.9% IoU. The proposed E-FPN presents a promising solution for enhancing object segmentation in challenging, multi-class real-world datasets, with potential applications extending beyond culvert-sewer defect detection.

arxiv情報

著者 Rasha Alshawi,Md Meftahul Ferdaus,Mahdi Abdelguerfi,Kendall Niles,Ken Pathak,Steve Sloan
発行日 2024-08-19 17:40:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク