要約
部分ラベル学習(PLL)は典型的な弱教師付き学習であり,各サンプルはラベル候補の集合と関連付けられている.PLLの基本的な仮定は、真正ラベルが候補集合の中に存在することである。しかし,アノテーターの専門外の判断により,この仮定が満たされない場合があり,PLLの実用的な適用が制限されている.本論文では、この仮定を緩和し、より一般的な問題であるノイズPLLに着目する。ノイズPLLでは、真正ラベルが候補集合に存在しない可能性がある。この問題に対処するため、我々は’Iterative Refinement Network (IRNet)’と呼ばれる新しいフレームワークを提案する。IRNetは、ノイズの多いサンプルの検出とラベル補正という2つの主要なモジュールによって、ノイズの多いサンプルを純化することを目的としている。理想的には、全てのノイジーサンプルが補正されれば、ノイジーPLLを従来のPLLに変換することができる。これらのモジュールの性能を保証するために、我々はウォームアップ学習から始め、予測誤差を減らすためにデータ拡張を利用する。理論解析により、IRNetがデータセットのノイズレベルを低減し、最終的にベイズ最適分類器を近似することができることを証明する。複数のベンチマークデータセットに対する実験結果から、我々の手法の有効性を実証する。IRNetはノイズの多いPLLにおいて、既存の最先端アプローチより優れている。
要約(オリジナル)
Partial label learning (PLL) is a typical weakly supervised learning, where each sample is associated with a set of candidate labels. The basic assumption of PLL is that the ground-truth label must reside in the candidate set. However, this assumption may not be satisfied due to the unprofessional judgment of the annotators, thus limiting the practical application of PLL. In this paper, we relax this assumption and focus on a more general problem, noisy PLL, where the ground-truth label may not exist in the candidate set. To address this challenging problem, we propose a novel framework called ‘Iterative Refinement Network (IRNet)’. It aims to purify the noisy samples by two key modules, i.e., noisy sample detection and label correction. Ideally, we can convert noisy PLL into traditional PLL if all noisy samples are corrected. To guarantee the performance of these modules, we start with warm-up training and exploit data augmentation to reduce prediction errors. Through theoretical analysis, we prove that IRNet is able to reduce the noise level of the dataset and eventually approximate the Bayes optimal classifier. Experimental results on multiple benchmark datasets demonstrate the effectiveness of our method. IRNet is superior to existing state-of-the-art approaches on noisy PLL.
arxiv情報
著者 | Zheng Lian,Mingyu Xu,Lan Chen,Licai Sun,Bin Liu,Jianhua Tao |
発行日 | 2023-01-04 11:58:39+00:00 |
arxivサイト | arxiv_id(pdf) |