ViGEO: an Assessment of Vision GNNs in Earth Observation


衛星ミッションと地球観測 (EO) システムは、環境モニタリングと大惨事のタイムリーな特定、天然資源と植生、水域、森林、建物などの人工資産の両方の長期モニタリングのための基本的な資産を表します。
さまざまな EO ミッションにより、MODIS、Sentinel-1、Sentinel-2 などのいくつかのスペクトル帯域幅に関する情報の収集が可能になります。
このように、最近の機械学習、コンピューター ビジョン、ラベル付きデータの利用可能性の進歩を考慮して、研究者らは、ディープ ニューラル ネットワークの使用による土地利用監視システムとリモート センシング画像分類の実現可能性と精度を実証しました。
コンピューター ビジョンの分野における最近の進歩にも関わらず、多くの研究では解析が畳み込みニューラル ネットワーク (CNN) に限定されており、最近ではビジョン トランスフォーマー (ViT) に限定されています。
時系列や画像などの非グラフ データに対するグラフ ニューラル ネットワーク (GNN) の最近の成功を考慮して、土地被覆分類のタスクに適用された最近の Vision GNN アーキテクチャ (ViG) のパフォーマンスを調査します。
実験結果は、ViG がマルチクラスおよびマルチラベルの分類コンテキストで最先端のパフォーマンスを達成し、大規模ベンチマークで ViT と ResNet の両方を上回ることを示しています。


Satellite missions and Earth Observation (EO) systems represent fundamental assets for environmental monitoring and the timely identification of catastrophic events, long-term monitoring of both natural resources and human-made assets, such as vegetation, water bodies, forests as well as buildings. Different EO missions enables the collection of information on several spectral bandwidths, such as MODIS, Sentinel-1 and Sentinel-2. Thus, given the recent advances of machine learning, computer vision and the availability of labeled data, researchers demonstrated the feasibility and the precision of land-use monitoring systems and remote sensing image classification through the use of deep neural networks. Such systems may help domain experts and governments in constant environmental monitoring, enabling timely intervention in case of catastrophic events (e.g., forest wildfire in a remote area). Despite the recent advances in the field of computer vision, many works limit their analysis on Convolutional Neural Networks (CNNs) and, more recently, to vision transformers (ViTs). Given the recent successes of Graph Neural Networks (GNNs) on non-graph data, such as time-series and images, we investigate the performances of a recent Vision GNN architecture (ViG) applied to the task of land cover classification. The experimental results show that ViG achieves state-of-the-art performances in multiclass and multilabel classification contexts, surpassing both ViT and ResNet on large-scale benchmarks.


著者 Luca Colomba,Paolo Garza
発行日 2024-02-15 14:16:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV パーマリンク