Satlas: A Large-Scale, Multi-Task Dataset for Remote Sensing Image Understanding

要約

リモート センシング画像は、森林伐採、違法漁業、都市拡大、自然災害の追跡など、さまざまな環境および地球監視タスクに役立ちます。
地球は非常に多様です。リモート センシング画像の潜在的なタスクの量は膨大で、フィーチャのサイズは数キロメートルからわずか数十センチメートルの範囲です。
ただし、一般化可能なコンピューター ビジョン手法を作成することは、多くのタスクでこれらの多様な機能をキャプチャする大規模なデータセットが不足していることが原因の 1 つです。
このホワイト ペーパーでは、137 のカテゴリと 7 つのラベル モダリティの下にある 2 億 9000 万のラベルで構成されるスケールだけでなく、前述のすべてのアプリケーションなどを備えた、幅の広いリモート センシング データセットおよびベンチマークである Satlas を紹介します。
Satlas で 8 つのベースラインと提案された方法を評価し、非常に異なるタイプのセンサーからの画像で構成される画像時系列の処理や、長時間のデータの活用など、リモート センシングに固有の研究課題への対処に改善の余地があることを発見しました。
-範囲空間コンテキスト。
また、Satlas で事前トレーニングを行うと、ラベル付けされた例がほとんどないダウンストリーム タスクのパフォーマンスが大幅に向上し、ImageNet よりも平均精度が 16% 向上し、次善のベースラインよりも 5% 向上することもわかりました。

要約(オリジナル)

Remote sensing images are useful for a wide variety of environmental and earth monitoring tasks, including tracking deforestation, illegal fishing, urban expansion, and natural disasters. The earth is extremely diverse — the amount of potential tasks in remote sensing images is massive, and the sizes of features range from several kilometers to just tens of centimeters. However, creating generalizable computer vision methods is a challenge in part due to the lack of a large-scale dataset that captures these diverse features for many tasks. In this paper, we present Satlas, a remote sensing dataset and benchmark that is large in both breadth, featuring all of the aforementioned applications and more, as well as scale, comprising 290M labels under 137 categories and seven label modalities. We evaluate eight baselines and a proposed method on Satlas, and find that there is substantial room for improvement in addressing research challenges specific to remote sensing, including processing image time series that consist of images from very different types of sensors, and taking advantage of long-range spatial context. We also find that pre-training on Satlas substantially improves performance on downstream tasks with few labeled examples, increasing average accuracy by 16% over ImageNet and 5% over the next best baseline.

arxiv情報

著者 Favyen Bastani,Piper Wolters,Ritwik Gupta,Joe Ferdinando,Aniruddha Kembhavi
発行日 2022-11-28 18:59:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク