A Self-Supervised Approach to Land Cover Segmentation

要約

土地利用/土地被覆変化 (LULC) マップは、地球科学と農業研究において不可欠なリソースです。
このようなマップの性質により、LULC マップの作成は、衛星画像やリモート センシング データに正確に注釈を付けるために必要な時間と人的リソースによって制限されることがよくあります。
セマンティック セグメンテーションを実行してそのようなデータから詳細なラベルを作成するコンピューター ビジョン モデルは珍しいことではありませんが、グラウンド トゥルース マスクを使用せずに LULC マップにラベルを付けるための自己教師ありおよび教師なしのアプローチに関する研究はほとんど行われていません。
ここでは、高品質のグラウンド トゥルース ラベルを必要としない、自己監視型の土地被覆セグメンテーションの方法を示します。
提案されている深層学習は、STEGO アーキテクチャで DINO から転送された凍結済みの事前トレーニング済み ViT バックボーンを採用し、超高解像度 (VHR) 衛星画像で構成されるカスタム データセットを使用して微調整されます。
わずか 10 エポックの微調整の後、5 つのサンプルにわたって約 52% の精度が観察され、VHR LULC マップの自動ラベル付けのための自己教師ありモデルの実現可能性が示されました。

要約(オリジナル)

Land use/land cover change (LULC) maps are integral resources in earth science and agricultural research. Due to the nature of such maps, the creation of LULC maps is often constrained by the time and human resources necessary to accurately annotate satellite imagery and remote sensing data. While computer vision models that perform semantic segmentation to create detailed labels from such data are not uncommon, litle research has been done on self-supervised and unsupervised approaches to labelling LULC maps without the use of ground-truth masks. Here, we demonstrate a self-supervised method of land cover segmentation that has no need for high-quality ground truth labels. The proposed deep learning employs a frozen pre-trained ViT backbone transferred from DINO in a STEGO architecture and is fine-tuned using a custom dataset consisting of very high resolution (VHR) sattelite imagery. After only 10 epochs of fine-tuning, an accuracy of roughly 52% was observed across 5 samples, signifying the feasibility of self-supervised models for the automated labelling of VHR LULC maps.

arxiv情報

著者 Charles Moore,Dakota Hester
発行日 2023-10-27 16:37:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク