DDU-Net: A Domain Decomposition-Based CNN for High-Resolution Image Segmentation on Multiple GPUs

要約

超高解像度画像のセグメンテーションは、空間情報の喪失や計算非効率性などの課題をもたらします。
この作業では、エンコーダデコダーアーキテクチャとこれらの課題に対処するためのドメイン分解戦略を組み合わせた新しいアプローチが提案されています。
具体的には、ドメイン分解ベースのU-NET(DDU-NET)アーキテクチャが導入されています。これは、個別のデバイスで個別に処理できる重複しないパッチに画像を分割します。
通信ネットワークが追加され、空間コンテキストの理解を高めるために、パッチ間情報交換を促進します。
実験的検証は、通信ネットワークの有効性を測定するように設計された合成データセットで実行されます。
次に、パフォーマンスは、DeepGlobeの土地カバー分類データセットで実際のベンチマークデータセットとしてテストされます。
結果は、16ドル\ Times16 $非重複サブイメージに分割された画像のパッチ間通信を含むアプローチが、パッチ間通信のない同じネットワークと比較して、2-3 \、\%$の交差点(IOU)スコアよりも高い交差点を達成することを示しています。
通信を含むネットワークのパフォーマンスは、完全な画像でトレーニングされたベースラインU-NETのパフォーマンスと同等であり、私たちのモデルが空間的コンテキストを保存しながら超高解像度画像をセグメント化するための効果的なソリューションを提供することを示しています。
このコードは、https://github.com/corne00/ddu-netで入手できます。

要約(オリジナル)

The segmentation of ultra-high resolution images poses challenges such as loss of spatial information or computational inefficiency. In this work, a novel approach that combines encoder-decoder architectures with domain decomposition strategies to address these challenges is proposed. Specifically, a domain decomposition-based U-Net (DDU-Net) architecture is introduced, which partitions input images into non-overlapping patches that can be processed independently on separate devices. A communication network is added to facilitate inter-patch information exchange to enhance the understanding of spatial context. Experimental validation is performed on a synthetic dataset that is designed to measure the effectiveness of the communication network. Then, the performance is tested on the DeepGlobe land cover classification dataset as a real-world benchmark data set. The results demonstrate that the approach, which includes inter-patch communication for images divided into $16\times16$ non-overlapping subimages, achieves a $2-3\,\%$ higher intersection over union (IoU) score compared to the same network without inter-patch communication. The performance of the network which includes communication is equivalent to that of a baseline U-Net trained on the full image, showing that our model provides an effective solution for segmenting ultra-high-resolution images while preserving spatial context. The code is available at https://github.com/corne00/DDU-Net.

arxiv情報

著者 Corné Verburg,Alexander Heinlein,Eric C. Cyr
発行日 2025-04-24 16:18:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 65N55, 68T07, 68U10, 68W10, 68W15, cs.CV, cs.DC, cs.LG, I.2.6 パーマリンク