Generative Reasoning Integrated Label Noise Robust Deep Image Representation Learning in Remote Sensing

要約

深層学習に基づく画像表現学習(IRL)手法の開発は、リモートセンシング(RS)の画像理解の文脈で大きな注目を集めている。これらの手法の多くは、大量かつ高品質な注釈付き学習画像の入手を必要とするが、その収集には時間とコストがかかることがある。ラベリングコストを削減するために、一般に公開されている主題図、自動ラベリング手順、クラウドソーシングデータを利用することができる。しかし、このようなアプローチでは、学習データにラベルノイズが含まれるリスクが高くなる。既存の手法のように識別推論を用いる場合、ノイズの多いラベルに対してオーバーフィッティングを起こす可能性がある。その結果、最適な学習が行えなくなり、RS 画像の特徴づけが不正確になる。本論文では、RSで初めて、生成推論統合ラベルノイズ耐性表現学習(GRID)アプローチを紹介する。GRIDは、ノイズの多いラベルの下でのIRLのための識別的推論と生成的推論の相補的な特性をモデル化することを目的としている。この目的のために、我々はまず、変分オートエンコーダを通して、生成的推論を識別的推論に統合する。これにより、本アプローチは、ラベルノイズのある学習サンプルを自動的に検出することができる。そして、ラベルノイズに強いハイブリッド表現学習戦略により、GRIDは、これらのサンプルのIRLを生成推論で、他のサンプルのIRLを識別推論で学習するように全体の学習手順を調整します。本手法は、IRL手法とは独立に、学習中のノイズの多いラベルの干渉を防ぎつつ、識別可能な画像表現を学習するものです。このように、既存の手法とは異なり、GRIDはアノテーションの種類、ラベルノイズ、ニューラルネットワーク、損失、学習タスクに依存しないため、様々なRS画像理解問題に利用することが可能である。実験結果により、GRIDの有効性が最先端の手法と比較して示される。

要約(オリジナル)

The development of deep learning based image representation learning (IRL) methods has attracted great attention in the context of remote sensing (RS) image understanding. Most of these methods require the availability of a high quantity and quality of annotated training images, which can be time-consuming and costly to gather. To reduce labeling costs, publicly available thematic maps, automatic labeling procedures or crowdsourced data can be used. However, such approaches increase the risk of including label noise in training data. It may result in overfitting on noisy labels when discriminative reasoning is employed as in most of the existing methods. This leads to sub-optimal learning procedures, and thus inaccurate characterization of RS images. In this paper, as a first time in RS, we introduce a generative reasoning integrated label noise robust representation learning (GRID) approach. GRID aims to model the complementary characteristics of discriminative and generative reasoning for IRL under noisy labels. To this end, we first integrate generative reasoning into discriminative reasoning through a variational autoencoder. This allows our approach to automatically detect training samples with noisy labels. Then, through our label noise robust hybrid representation learning strategy, GRID adjusts the whole learning procedure for IRL of these samples through generative reasoning and that of the other samples through discriminative reasoning. Our approach learns discriminative image representations while preventing interference of noisy labels during training independently from the IRL method. Thus, unlike the existing methods, GRID does not depend on the type of annotation, label noise, neural network, loss or learning task, and thus can be utilized for various RS image understanding problems. Experimental results show the effectiveness of GRID compared to state-of-the-art methods.

arxiv情報

著者 Gencer Sumbul,Begüm Demir
発行日 2022-12-02 15:57:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク