要約
生物多様性と気候の危機の悪化により、グローバルな生物多様性マッピングなどの主要生態学的追求がより緊急になります。
リモートセンシングは、生態学的研究のための豊富な地球観測データを提供しますが、ラベル付きのデータセットの希少性は依然として大きな課題です。
最近、自己学習学習により、非標識データからの学習表現が可能になり、一般化可能な機能を備えた前提条件の地理空間モデルの開発が引き起こされました。
ただし、これらのモデルは、多くの場合、高い人間の活動の領域に偏っているデータセットで訓練されており、生態学的領域全体が過小評価されています。
さらに、一部のデータセットはマルチデート画像を通じて季節性に対処しようとしますが、通常、ローカルの生物季節学的サイクルではなく、カレンダーシーズンに従います。
グローバルスケールで植生の季節性を向上させるために、単純なフェノロジーに基づいたサンプリング戦略を提案し、対応するSSL4ECOを導入します。
SSL4ECOから学んだ表現を、多様な生態学的なダウンストリームタスクに関する他のデータセットと比較し、簡単なサンプリング方法が表現品質を一貫して改善し、データセット構築の重要性を強調することを示しています。
SSL4ECOで前処理されたモデルは、8つのダウンストリームタスク(マルチラベル)の分類と回帰にまたがる最先端のパフォーマンスに到達します。
https://github.com/plekhanovaelena/ssl4ecoでマクロ生態学的およびコンピュータービジョンの研究をサポートするために、コード、データ、およびモデルの重みをリリースします。
要約(オリジナル)
With the exacerbation of the biodiversity and climate crises, macroecological pursuits such as global biodiversity mapping become more urgent. Remote sensing offers a wealth of Earth observation data for ecological studies, but the scarcity of labeled datasets remains a major challenge. Recently, self-supervised learning has enabled learning representations from unlabeled data, triggering the development of pretrained geospatial models with generalizable features. However, these models are often trained on datasets biased toward areas of high human activity, leaving entire ecological regions underrepresented. Additionally, while some datasets attempt to address seasonality through multi-date imagery, they typically follow calendar seasons rather than local phenological cycles. To better capture vegetation seasonality at a global scale, we propose a simple phenology-informed sampling strategy and introduce corresponding SSL4Eco, a multi-date Sentinel-2 dataset, on which we train an existing model with a season-contrastive objective. We compare representations learned from SSL4Eco against other datasets on diverse ecological downstream tasks and demonstrate that our straightforward sampling method consistently improves representation quality, highlighting the importance of dataset construction. The model pretrained on SSL4Eco reaches state of the art performance on 7 out of 8 downstream tasks spanning (multi-label) classification and regression. We release our code, data, and model weights to support macroecological and computer vision research at https://github.com/PlekhanovaElena/ssl4eco.
arxiv情報
著者 | Elena Plekhanova,Damien Robert,Johannes Dollinger,Emilia Arens,Philipp Brun,Jan Dirk Wegner,Niklaus Zimmermann |
発行日 | 2025-04-25 10:58:44+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google