Rethinking the U-Net, ResUnet, and U-Net3+ architectures with dual skip connections for building footprint extraction

要約

建築物のフットプリントとそのインベントリの重要性は、さまざまな社会問題の基礎となる空間情報として認識されている。複雑な都市の建物を抽出するには、超高解像度(VHR)地球観測(EO)画像のセグメンテーションが必要である。U-Netは一般的なディープラーニングネットワークであり、このようなセグメンテーションのためのResUnet、U-Net++、U-Net3+といった新しい転生の基盤である。これらの新生U-Netは、スキップ接続コンポーネントを再設計し、U-Netのマルチスケール特徴を利用することで、効率化を図っている。しかし、スキップ接続が必ずしもこれらのネットワークを改善するとは限らず、スキップ接続の一部を削除することで効率性が向上し、ネットワーク・パラメータが減少する。本論文では、U-Net、ResUnet、U-Net3+の3つのデュアルスキップ接続メカニズムを提案する。これらのメカニズムは、スキップ接続によって転送される特徴マップを深くし、どのスキップ接続をより密にすれば最も高い効率向上が得られるかを研究することを可能にする。これらのメカニズムは、3つのネットワークの異なるスケールの特徴マップで評価され、9つの新しいネットワーク構成が生成される。これらのネットワークは、空間解像度の異なる4つの建物フットプリントデータセット(既存3つ、新規1つ)を用いて、オリジナルのバニラバージョンに対して評価される:VHR(0.3m)、高解像度(1mと1.2m)、マルチ解像度(0.3+0.6+1.2m)である。提案されたメカニズムは、U-NetとResUnetの4つの評価指標で効率向上を報告し、U-Net3+のF1スコアとIntersection over Union (IoU)で最大17.7%と18.4%の向上を報告する。コードは査読後、GitHubリンクで公開される予定である。

要約(オリジナル)

The importance of building footprints and their inventory has been recognised as foundational spatial information for multiple societal problems. Extracting complex urban buildings involves the segmentation of very high-resolution (VHR) earth observation (EO) images. U-Net is a common deep learning network and foundation for its new incarnations like ResUnet, U-Net++ and U-Net3+ for such segmentation. The re-incarnations look for efficiency gain by re-designing the skip connection component and exploiting the multi-scale features in U-Net. However, skip connections do not always improve these networks and removing some of them provides efficiency gains and reduced network parameters. In this paper, we propose three dual skip connection mechanisms for U-Net, ResUnet, and U-Net3+. These mechanisms deepen the feature maps forwarded by the skip connections and allow us to study which skip connections need to be denser to yield the highest efficiency gain. The mechanisms are evaluated on feature maps of different scales in the three networks, producing nine new network configurations. The networks are evaluated against their original vanilla versions using four building footprint datasets (three existing and one new) of different spatial resolutions: VHR (0.3m), high-resolution (1m and 1.2m), and multi-resolution (0.3+0.6+1.2m). The proposed mechanisms report efficiency gain on four evaluation measures for U-Net and ResUnet, and up to 17.7% and 18.4% gain in F1 score and Intersection over Union (IoU) for U-Net3+. The codes will be available in a GitHub link after peer review.

arxiv情報

著者 Bipul Neupane,Jagannath Aryal,Abbas Rajabifard
発行日 2023-07-03 13:46:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, eess.IV パーマリンク