SoLar: Sinkhorn Label Refinery for Imbalanced Partial-Label Learning

要約

部分ラベル学習 (PLL) は、通常、トレーニング サンプルが単一のグラウンド トゥルースではなく候補ラベルのセットに関連付けられている、特殊な弱教師付き学習タスクです。
このドメインではさまざまなラベルの曖昧さ回避方法が提案されていますが、通常、それらは多くの実際のアプリケーションでは成り立たない可能性があるクラス バランスのとれたシナリオを想定しています。
経験的に、ロングテール分布と部分ラベル付けからの組み合わせの課題に直面した場合、以前の方法のパフォーマンスの低下が観察されます。
この作業では、まず、以前の作業が失敗した主な理由を特定します。
その後、SoLar を提案します。これは、周辺クラスの事前分布に一致するように明確化されたラベルを改良することを可能にする、新しい Optimal Transport ベースのフレームワークです。
さらに、SoLar には、PLL セットアップの下でロングテール クラスの事前分布を推定するための新しい体系的なメカニズムが組み込まれています。
広範な実験を通じて、SoLar は、標準化されたベンチマークで、以前の最先端の PLL 方式と比較して大幅に優れた結果を示しています。
コードとデータは https://github.com/hbzju/SoLar で入手できます。

要約(オリジナル)

Partial-label learning (PLL) is a peculiar weakly-supervised learning task where the training samples are generally associated with a set of candidate labels instead of single ground truth. While a variety of label disambiguation methods have been proposed in this domain, they normally assume a class-balanced scenario that may not hold in many real-world applications. Empirically, we observe degenerated performance of the prior methods when facing the combinatorial challenge from the long-tailed distribution and partial-labeling. In this work, we first identify the major reasons that the prior work failed. We subsequently propose SoLar, a novel Optimal Transport-based framework that allows to refine the disambiguated labels towards matching the marginal class prior distribution. SoLar additionally incorporates a new and systematic mechanism for estimating the long-tailed class prior distribution under the PLL setup. Through extensive experiments, SoLar exhibits substantially superior results on standardized benchmarks compared to the previous state-of-the-art PLL methods. Code and data are available at: https://github.com/hbzju/SoLar .

arxiv情報

著者 Haobo Wang,Mingxuan Xia,Yixuan Li,Yuren Mao,Lei Feng,Gang Chen,Junbo Zhao
発行日 2022-09-21 14:00:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク