要約
この論文では、リモート センシング画像解析のための深層学習 (DL) 研究をサポートするために構築された大規模なマルチモーダル リモート センシング データセットである、洗練された BigEarthNet (reBEN) について説明します。
reBEN データセットは、549,488 組の Sentinel-1 および Sentinel-2 イメージ パッチで構成されています。
reBEN を構築するには、まず BigEarthNet データセットの構築に使用される Sentinel-1 タイルと Sentinel-2 タイルを考慮し、次にそれらをサイズ 1200 m x 1200 m のパッチに分割します。
最新バージョンの sen2cor ツールを使用して Sentinel-2 パッチに大気補正を適用し、BigEarthNet に存在するパッチと比較して高品質のパッチが得られます。
各パッチは、ピクセル レベルのリファレンス マップとシーン レベルのマルチラベルに関連付けられます。
これにより、reBEN はピクセルベースおよびシーンベースの学習タスクに適したものになります。
ラベルは、BigEarthNet と同様に 19 クラスの命名法を利用して、2018 年の最新の CORINE Land Cover (CLC) マップから派生しています。
最新の CLC マップを使用すると、BigEarthNet に存在するラベル ノイズが克服されます。
さらに、BigEarthNet に存在するトレーニング セット、検証セット、およびテスト セット間の空間相関を大幅に低減する、新しい地理ベースの分割割り当てアルゴリズムを導入します。
これにより、DL モデルの評価の信頼性が向上します。
DL モデルのトレーニング時間を最小限に抑えるために、reBEN データセットを DL に最適化されたデータ形式に変換するソフトウェア ツールを導入します。
私たちの実験では、いくつかの最先端の DL モデルを考慮することで、マルチモーダル、マルチラベルの画像分類問題に対する reBEN の可能性を示します。
事前トレーニングされたモデルの重み、関連コード、完全なデータセットは https://bigearth.net で入手できます。
要約(オリジナル)
This paper presents refined BigEarthNet (reBEN) that is a large-scale, multi-modal remote sensing dataset constructed to support deep learning (DL) studies for remote sensing image analysis. The reBEN dataset consists of 549,488 pairs of Sentinel-1 and Sentinel-2 image patches. To construct reBEN, we initially consider the Sentinel-1 and Sentinel-2 tiles used to construct the BigEarthNet dataset and then divide them into patches of size 1200 m x 1200 m. We apply atmospheric correction to the Sentinel-2 patches using the latest version of the sen2cor tool, resulting in higher-quality patches compared to those present in BigEarthNet. Each patch is then associated with a pixel-level reference map and scene-level multi-labels. This makes reBEN suitable for pixel- and scene-based learning tasks. The labels are derived from the most recent CORINE Land Cover (CLC) map of 2018 by utilizing the 19-class nomenclature as in BigEarthNet. The use of the most recent CLC map results in overcoming the label noise present in BigEarthNet. Furthermore, we introduce a new geographical-based split assignment algorithm that significantly reduces the spatial correlation among the train, validation, and test sets with respect to those present in BigEarthNet. This increases the reliability of the evaluation of DL models. To minimize the DL model training time, we introduce software tools that convert the reBEN dataset into a DL-optimized data format. In our experiments, we show the potential of reBEN for multi-modal multi-label image classification problems by considering several state-of-the-art DL models. The pre-trained model weights, associated code, and complete dataset are available at https://bigearth.net.
arxiv情報
著者 | Kai Norman Clasen,Leonard Hackel,Tom Burgert,Gencer Sumbul,Begüm Demir,Volker Markl |
発行日 | 2024-07-29 12:53:20+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google