Benchmarking and scaling of deep learning models for land cover image classification

要約

Copernicus Sentinel-2 の膨大な量の画像が利用可能になったことで、土地利用土地被覆 (LULC) 画像分類にディープ ラーニング (DL) 手法を活用する新たな機会が生まれました。
ただし、ベンチマーク実験の広範なセットが現在不足しています。つまり、同じデータセットで、共通の一貫したメトリック セットを使用して、同じハードウェアでテストされた DL モデルです。
この作業では、BigEarthNet Sentinel-2 データセットを使用して、マルチラベル、マルチクラスの LULC 画像分類問題に対するさまざまな最先端の DL モデルを初めてベンチマークし、60 の訓練された徹底的な動物園に貢献しました
モデル。
私たちのベンチマークには、標準の CNN と非畳み込み手法が含まれています。
EfficientNets および Wide Residual Networks (WRN) アーキテクチャをテストし、分類精度、トレーニング時間、および推論率を活用します。
さらに、軽量WRNの複合スケーリングにEfficientNetフレームワークを使用することを提案します。
Efficient Channel Attention メカニズムで強化された、スケーリングされた軽量モデルは、新しい最先端技術として登場しました。
標準の ResNet50 ベースライン モデルと比較して、19 の LULC クラスすべてで 4.5% 高い平均 F スコア分類精度を達成し、トレーニング可能なパラメーターが桁違いに少なくなります。
複数の GPU ノードでの分散トレーニング用のコードとともに、すべてのトレーニング済みモデルへのアクセスを提供します。
ImageNet などの別のドメインからのデータでトレーニングされたバックボーン モデルを利用する代わりに、Sentinel-2 データを使用するさまざまなリモート センシング タスクで、この事前トレーニング済みエンコーダーのモデル ズーを転移学習とラピッド プロトタイピングに使用できます。
さまざまなボリュームのさまざまなデータセットでの転移学習への適合性を検証します。
当社の最高性能の WRN は、SEN12MS データセットで最先端のパフォーマンス (71.1% F スコア) を達成しながら、トレーニング データセットのごく一部のみにさらされています。

要約(オリジナル)

The availability of the sheer volume of Copernicus Sentinel-2 imagery has created new opportunities for exploiting deep learning (DL) methods for land use land cover (LULC) image classification. However, an extensive set of benchmark experiments is currently lacking, i.e. DL models tested on the same dataset, with a common and consistent set of metrics, and in the same hardware. In this work, we use the BigEarthNet Sentinel-2 dataset to benchmark for the first time different state-of-the-art DL models for the multi-label, multi-class LULC image classification problem, contributing with an exhaustive zoo of 60 trained models. Our benchmark includes standard CNNs, as well as non-convolutional methods. We put to the test EfficientNets and Wide Residual Networks (WRN) architectures, and leverage classification accuracy, training time and inference rate. Furthermore, we propose to use the EfficientNet framework for the compound scaling of a lightweight WRN. Enhanced with an Efficient Channel Attention mechanism, our scaled lightweight model emerged as the new state-of-the-art. It achieves 4.5% higher averaged F-Score classification accuracy for all 19 LULC classes compared to a standard ResNet50 baseline model, with an order of magnitude less trainable parameters. We provide access to all trained models, along with our code for distributed training on multiple GPU nodes. This model zoo of pre-trained encoders can be used for transfer learning and rapid prototyping in different remote sensing tasks that use Sentinel-2 data, instead of exploiting backbone models trained with data from a different domain, e.g., from ImageNet. We validate their suitability for transfer learning in different datasets of diverse volumes. Our top-performing WRN achieves state-of-the-art performance (71.1% F-Score) on the SEN12MS dataset while being exposed to only a small fraction of the training dataset.

arxiv情報

著者 Ioannis Papoutsis,Nikolaos-Ioannis Bountos,Angelos Zavras,Dimitrios Michail,Christos Tryfonopoulos
発行日 2022-09-14 08:54:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク