G2NetPL: Generic Game-Theoretic Network for Partial-Label Image Classification

要約

マルチラベル画像分類は、画像内のすべての可能なラベルを予測することを目的としています。
すべてのトレーニング画像のすべてのラベルに注釈を付けると実際にはコストがかかる可能性があるため、通常は部分ラベル学習問題として定式化されます。
部分ラベル学習に関する既存の作業は、各トレーニング画像がその正/負のラベルのサブセットのみでラベル付けされている場合に焦点を当てています。
部分ラベル分類に効果的に対処するために、このホワイト ペーパーでは、部分ラベル学習用のエンド ツー エンドの汎用ゲーム理論ネットワーク (G2NetPL) を提案します。
トレーニング画像のサブセットのみがラベル付けされ、それぞれに 1 つのポジティブ ラベルのみが付けられ、残りのトレーニング画像にはラベル付けされない効率的なケース。
G2NetPL では、観測されていない各ラベルはソフト疑似ラベルに関連付けられており、ネットワークと共に、2 人のプレイヤーによる非ゼロサム非協力ゲームを作成します。
ネットワークの目的は、与えられた疑似ラベルで損失関数を最小化することですが、疑似ラベルは、ネットワークによって決定された予測ラベルから逸脱するというペナルティで 1 (正) または 0 (負) に収束しようとします。
さらに、ネットワークの損失に信頼性を考慮したスケジューラーを導入して、さまざまなラベルに対してイージーからハードへの学習を適応的に実行します。
広範な実験により、提案された G2NetPL が、3 つの異なるデータセットのさまざまな部分ラベル設定の下で、多くの最先端のマルチラベル分類方法よりも優れていることが実証されています。

要約(オリジナル)

Multi-label image classification aims to predict all possible labels in an image. It is usually formulated as a partial-label learning problem, since it could be expensive in practice to annotate all the labels in every training image. Existing works on partial-label learning focus on the case where each training image is labeled with only a subset of its positive/negative labels. To effectively address partial-label classification, this paper proposes an end-to-end Generic Game-theoretic Network (G2NetPL) for partial-label learning, which can be applied to most partial-label settings, including a very challenging, but annotation-efficient case where only a subset of the training images are labeled, each with only one positive label, while the rest of the training images remain unlabeled. In G2NetPL, each unobserved label is associated with a soft pseudo label, which, together with the network, formulates a two-player non-zero-sum non-cooperative game. The objective of the network is to minimize the loss function with given pseudo labels, while the pseudo labels will seek convergence to 1 (positive) or 0 (negative) with a penalty of deviating from the predicted labels determined by the network. In addition, we introduce a confidence-aware scheduler into the loss of the network to adaptively perform easy-to-hard learning for different labels. Extensive experiments demonstrate that our proposed G2NetPL outperforms many state-of-the-art multi-label classification methods under various partial-label settings on three different datasets.

arxiv情報

著者 Rabab Abdelfattah,Xin Zhang,Mostafa M. Fouda,Xiaofeng Wang,Song Wang
発行日 2022-10-20 17:59:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク