要約
既存の半教師あり学習アルゴリズムは、擬似ラベル付けおよび一貫性調整技術を採用して、ラベルのないサンプルに監視信号を導入します。
しきい値ベースの擬似ラベル付けの固有の制限を克服するために、これまでの研究では、ラベルなしのデータに対して行われた予測を通じて推定されるモデルの進化する学習ステータスに信頼しきい値を合わせることが試みられてきました。
この論文では、分類器の重みがカテゴリ間で差別化された学習ステータスを反映できることをさらに明らかにし、その結果、クラス固有の適応閾値メカニズムを提案します。
さらに、最適なしきい値スキームでもラベルのないサンプルを破棄する問題を解決できないことを考慮して、すべてのラベルのないサンプルについて、候補クラスを否定的なオプションから区別するバイナリ分類一貫性規制アプローチが設計されています。
上記の戦略を組み合わせることで、AllMatch という名前の新しい SSL アルゴリズムを提案します。これにより、擬似ラベルの精度が向上し、ラベルのないデータの利用率が 100% になります。
私たちは、バランスの取れた設定とアンバランスな設定の両方を含む、複数のベンチマークでアプローチを広範囲に評価しています。
結果は、AllMatch が既存の最先端の手法を常に上回るパフォーマンスを示していることを示しています。
要約(オリジナル)
Existing semi-supervised learning algorithms adopt pseudo-labeling and consistency regulation techniques to introduce supervision signals for unlabeled samples. To overcome the inherent limitation of threshold-based pseudo-labeling, prior studies have attempted to align the confidence threshold with the evolving learning status of the model, which is estimated through the predictions made on the unlabeled data. In this paper, we further reveal that classifier weights can reflect the differentiated learning status across categories and consequently propose a class-specific adaptive threshold mechanism. Additionally, considering that even the optimal threshold scheme cannot resolve the problem of discarding unlabeled samples, a binary classification consistency regulation approach is designed to distinguish candidate classes from negative options for all unlabeled samples. By combining the above strategies, we present a novel SSL algorithm named AllMatch, which achieves improved pseudo-label accuracy and a 100% utilization ratio for the unlabeled data. We extensively evaluate our approach on multiple benchmarks, encompassing both balanced and imbalanced settings. The results demonstrate that AllMatch consistently outperforms existing state-of-the-art methods.
arxiv情報
著者 | Zhiyu Wu,Jinshi Cui |
発行日 | 2024-07-09 14:35:57+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google