Deep Active Learning for Multi-Label Classification of Remote Sensing Images


近年、リモートセンシング画像のマルチラベル分類の分野で、ディープニューラルネットワーク(DNN)の利用が注目されている。DNNの膨大なパラメータを最適化するためには、マルチラベルで注釈された信頼性の高い多数の学習画像が必要になることが多い。しかし、大規模な学習セットの収集には時間、複雑さ、コストがかかる。本論文では、DNNのアノテーション作業を最小限にするために、RS画像のMLCのためのDNNの文脈における能動学習(AL)のためのいくつかのクエリ関数を提示する。単一ラベルの分類やセマンティックセグメンテーション問題のために定義されたALクエリ関数とは異なり、本論文で紹介する各クエリ関数は、i) マルチラベルの不確実性と ii) マルチラベルの多様性の2つの基準の評価に基づいている。マルチラベルの不確実性の基準は、各画像にマルチラベルを正しく割り当てる際のDNNの信頼性に関連する。マルチラベルの不確実性を評価するために、我々は3つの戦略を提示し、MLC問題に適応させる。i) マルチラベル損失順序の学習、ii) マルチラベル予測の時間的不一致の測定、iii) 近似勾配埋込の大きさの測定である。マルチラベル多様性基準は、不確実な画像間の冗長性を減らすために、できるだけ多様な画像の集合を選択することを目的としている。この基準を評価するために、クラスタリングに基づく戦略を利用する。上記の各不確実性戦略とクラスタリングに基づく多様性戦略を組み合わせることで、3つの異なるクエリ関数を実現する。2つのベンチマークアーカイブで得られた実験結果は、我々のクエリー関数が、MLCの文脈におけるALプロセスの各反復において、非常に情報量の多いサンプルセットの選択につながることを示している。


The use of deep neural networks (DNNs) has recently attracted great attention in the framework of the multi-label classification (MLC) of remote sensing (RS) images. To optimize the large number of parameters of DNNs a high number of reliable training images annotated with multi-labels is often required. However, the collection of a large training set is time-consuming, complex and costly. To minimize annotation efforts for data-demanding DNNs, in this paper we present several query functions for active learning (AL) in the context of DNNs for the MLC of RS images. Unlike the AL query functions defined for single-label classification or semantic segmentation problems, each query function presented in this paper is based on the evaluation of two criteria: i) multi-label uncertainty; and ii) multi-label diversity. The multi-label uncertainty criterion is associated to the confidence of the DNNs in correctly assigning multi-labels to each image. To assess the multi-label uncertainty, we present and adapt to the MLC problems three strategies: i) learning multi-label loss ordering; ii) measuring temporal discrepancy of multi-label prediction; and iii) measuring magnitude of approximated gradient embedding. The multi-label diversity criterion aims at selecting a set of uncertain images that are as diverse as possible to reduce the redundancy among them. To assess this criterion we exploit a clustering based strategy. We combine each of the above-mentioned uncertainty strategy with the clustering based diversity strategy, resulting in three different query functions. Experimental results obtained on two benchmark archives show that our query functions result in the selection of a highly informative set of samples at each iteration of the AL process in the context of MLC.


著者 Lars Möllenbrok,Begüm Demir
発行日 2022-12-02 13:41:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, DeepL

カテゴリー: cs.CV パーマリンク