Land Cover and Land Use Detection using Semi-Supervised Learning

要約

半教師あり学習 (SSL) は、リモート センシングの分野で大きな進歩を遂げました。
SSL メソッドのラベル付きデータセットを大量に見つけることは珍しく、手動でデータセットにラベルを付けるには費用と時間がかかります。
さらに、リモートセンシング衛星画像を正確に特定することは、従来の画像よりも複雑です。
クラスの不均衡なデータセットは別の一般的な現象であり、これらでトレーニングされたモデルは多数派のクラスに偏ります。
これは、SSL モデルの標準以下のパフォーマンスでは重大な問題になります。
ラベル付けされていないデータのラベル付けの問題に対処し、不均衡なデータセットによるモデルのバイアスの問題を解決しながら、精度を向上させることを目指しています。
これを達成するために、「人工的な」ラベルを作成し、妥当な精度を持つようにモデルをトレーニングします。
分散アライメント手法を使用したリサンプリングにより、クラスを繰り返し再分散します。
EuroSAT、UCM、WHU-RS19 など、さまざまなクラスの不均衡な衛星画像データセットを使用しています。
UCM バランスの取れたデータセットでは、この方法は以前の方法である MSMatch と FixMatch よりもそれぞれ 1.21% と 0.6% 優れています。
不均衡な EuroSAT の場合、私たちの方法は、MSMatch と FixMatch をそれぞれ 1.08% と 1% 上回っています。
私たちのアプローチは、ラベル付けされたデータの要件を大幅に軽減し、一貫して代替アプローチよりも優れており、データセットのクラスの不均衡によって引き起こされるモデル バイアスの問題を解決します。

要約(オリジナル)

Semi-supervised learning (SSL) has made significant strides in the field of remote sensing. Finding a large number of labeled datasets for SSL methods is uncommon, and manually labeling datasets is expensive and time-consuming. Furthermore, accurately identifying remote sensing satellite images is more complicated than it is for conventional images. Class-imbalanced datasets are another prevalent phenomenon, and models trained on these become biased towards the majority classes. This becomes a critical issue with an SSL model’s subpar performance. We aim to address the issue of labeling unlabeled data and also solve the model bias problem due to imbalanced datasets while achieving better accuracy. To accomplish this, we create ‘artificial’ labels and train a model to have reasonable accuracy. We iteratively redistribute the classes through resampling using a distribution alignment technique. We use a variety of class imbalanced satellite image datasets: EuroSAT, UCM, and WHU-RS19. On UCM balanced dataset, our method outperforms previous methods MSMatch and FixMatch by 1.21% and 0.6%, respectively. For imbalanced EuroSAT, our method outperforms MSMatch and FixMatch by 1.08% and 1%, respectively. Our approach significantly lessens the requirement for labeled data, consistently outperforms alternative approaches, and resolves the issue of model bias caused by class imbalance in datasets.

arxiv情報

著者 Fahmida Tasnim Lisa,Md. Zarif Hossain,Sharmin Naj Mou,Shahriar Ivan,Md. Hasanul Kabir
発行日 2022-12-21 17:36:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク