要約
このペーパーでは、リモートセンシング画像分析のためのディープラーニング(DL)研究をサポートするために構築された大規模なマルチモーダルリモートセンシングデータセットである洗練されたbigearthnet(Reben)を紹介します。
Rebenデータセットは、549,488ペアのSentinel-1とSentinel-2画像パッチで構成されています。
Rebenを構築するために、最初にBigeArthNetデータセットを構築するために使用されるSentinel-1およびSentinel-2タイルを検討し、それらをサイズ1200 m x 1200 mのパッチに分割します。
Sen2Corツールの最新バージョンを使用して、Sentinel-2パッチに大気補正を適用し、BigeArthNetに存在するものと比較して高品質のパッチをもたらします。
各パッチは、ピクセルレベルの参照マップとシーンレベルのマルチラベルに関連付けられます。
これにより、Rebenはピクセルおよびシーンベースの学習タスクに適しています。
ラベルは、BigeArthNetのように19クラスの命名法を利用することにより、2018年の最新のCorine Land Cover(CLC)マップから派生しています。
最新のCLCマップを使用すると、BigeArthNetに存在するラベルノイズを克服します。
さらに、BigeArthNetに存在するものに関して列車、検証、およびテストセット間の空間相関を大幅に削減する新しい地理ベースの分割割り当てアルゴリズムを導入します。
これにより、DLモデルの評価の信頼性が向上します。
DLモデルトレーニング時間を最小限に抑えるために、RebenデータセットをDL-Optimizedデータ形式に変換するソフトウェアツールを導入します。
実験では、いくつかの最先端のDLモデルを考慮して、マルチモーダルマルチラベル画像分類の問題に対するRebenの可能性を示しています。
事前に訓練されたモデルの重み、関連するコード、および完全なデータセットは、https://bigearth.netで入手できます。
要約(オリジナル)
This paper presents refined BigEarthNet (reBEN) that is a large-scale, multi-modal remote sensing dataset constructed to support deep learning (DL) studies for remote sensing image analysis. The reBEN dataset consists of 549,488 pairs of Sentinel-1 and Sentinel-2 image patches. To construct reBEN, we initially consider the Sentinel-1 and Sentinel-2 tiles used to construct the BigEarthNet dataset and then divide them into patches of size 1200 m x 1200 m. We apply atmospheric correction to the Sentinel-2 patches using the latest version of the sen2cor tool, resulting in higher-quality patches compared to those present in BigEarthNet. Each patch is then associated with a pixel-level reference map and scene-level multi-labels. This makes reBEN suitable for pixel- and scene-based learning tasks. The labels are derived from the most recent CORINE Land Cover (CLC) map of 2018 by utilizing the 19-class nomenclature as in BigEarthNet. The use of the most recent CLC map results in overcoming the label noise present in BigEarthNet. Furthermore, we introduce a new geographical-based split assignment algorithm that significantly reduces the spatial correlation among the train, validation, and test sets with respect to those present in BigEarthNet. This increases the reliability of the evaluation of DL models. To minimize the DL model training time, we introduce software tools that convert the reBEN dataset into a DL-optimized data format. In our experiments, we show the potential of reBEN for multi-modal multi-label image classification problems by considering several state-of-the-art DL models. The pre-trained model weights, associated code, and complete dataset are available at https://bigearth.net.
arxiv情報
著者 | Kai Norman Clasen,Leonard Hackel,Tom Burgert,Gencer Sumbul,Begüm Demir,Volker Markl |
発行日 | 2025-05-16 15:49:37+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google