A diverse large-scale building dataset and a novel plug-and-play domain generalization method for building extraction

要約

この論文では、新しい建物データセットを紹介し、高解像度のリモートセンシング画像からの建物抽出の開発を容易にするための新しいドメイン一般化方法を提案します。
現在の建物データセットの問題は、多様性に欠けていること、ラベルの品質が不十分であること、モデルの実際のパフォーマンスを実際に適切に評価するために、優れた汎化能力を備えた建物抽出モデルをトレーニングするためにほとんど使用されていないことです。
シーン。
これらの問題に対処するために、より実践志向の WHU-Mix 建物データセットという名前の多様で大規模な高品質の建物データセットを構築しました。
WHU-Mix 建物データセットは、世界中から収集された 43,727 の多様な画像を含むトレーニング/検証セットと、5 つの大陸の他の 5 つの都市からの 8402 の画像を含むテスト セットで構成されています。
さらに、建物抽出モデルの一般化能力をさらに向上させるために、建物のフロントエンドに効率的なプラグアンドプレイ モジュールとして埋め込むことができるバッチ スタイル ミキシング (BSM) という名前のドメイン一般化手法を提案します。
データ不変の知識を学習するために、徐々に大きくなるデータ分布をモデルに提供します。
この調査で実施された実験では、WHU-Mix 建物データセットが建物抽出モデルのパフォーマンスを向上させる可能性が確認され、他の既存のデータセットと比較して mIoU が 6 ~ 36% 改善されました。
他のデータセットの不正確なラベルの悪影響により、IoU が約 20% 減少する可能性があります。
実験では、提案された BSM モジュールがモデルの汎化能力とロバスト性を強化する高性能を確認し、ドメインの汎化なしのベースライン モデルを 13%、最近のドメインの汎化手法を mIoU で 4 ~ 15% 超えました。

要約(オリジナル)

In this paper, we introduce a new building dataset and propose a novel domain generalization method to facilitate the development of building extraction from high-resolution remote sensing images. The problem with the current building datasets involves that they lack diversity, the quality of the labels is unsatisfactory, and they are hardly used to train a building extraction model with good generalization ability, so as to properly evaluate the real performance of a model in practical scenes. To address these issues, we built a diverse, large-scale, and high-quality building dataset named the WHU-Mix building dataset, which is more practice-oriented. The WHU-Mix building dataset consists of a training/validation set containing 43,727 diverse images collected from all over the world, and a test set containing 8402 images from five other cities on five continents. In addition, to further improve the generalization ability of a building extraction model, we propose a domain generalization method named batch style mixing (BSM), which can be embedded as an efficient plug-and-play module in the frond-end of a building extraction model, providing the model with a progressively larger data distribution to learn data-invariant knowledge. The experiments conducted in this study confirmed the potential of the WHU-Mix building dataset to improve the performance of a building extraction model, resulting in a 6-36% improvement in mIoU, compared to the other existing datasets. The adverse impact of the inaccurate labels in the other datasets can cause about 20% IoU decrease. The experiments also confirmed the high performance of the proposed BSM module in enhancing the generalization ability and robustness of a model, exceeding the baseline model without domain generalization by 13% and the recent domain generalization methods by 4-15% in mIoU.

arxiv情報

著者 Muying Luo,Shunping Ji,Shiqing Wei
発行日 2022-10-17 13:32:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク