要約
完璧な監視を獲得することは通常難しいため、現実世界の機械学習タスクでは、不正確、不完全、または不正確な監視 (総称して「弱い監視」と呼ばれます) に直面することがよくあります。
この研究では、弱教師あり AUC 最適化問題のための統一フレームワークである WSAUC を紹介します。これは、ノイズのあるラベル学習、ポジティブなラベルなし学習、マルチインスタンス学習、および半教師あり学習のシナリオをカバーします。
WSAUC フレームワーク内で、我々はまず、汚染されたセットの AUC リスクを最小化するための共通の定式化として、さまざまな弱く監視されたシナリオにおける AUC 最適化問題を組み立て、経験的なリスク最小化問題が真の AUC と一致することを実証します。
次に、新しいタイプの部分 AUC、具体的には逆部分 AUC (rpAUC) を導入します。これは、汚染されたラベルの存在下で AUC を最大化するための強力なトレーニング目標として機能します。
WSAUC は、経験的な rpAUC を最大化することにより、さまざまな弱く監視されたシナリオで AUC を最適化するための汎用ソリューションを提供します。
複数の設定における理論的および実験的結果は、一連の弱く監視された AUC 最適化タスクにおける WSAUC の有効性を裏付けています。
要約(オリジナル)
Since acquiring perfect supervision is usually difficult, real-world machine learning tasks often confront inaccurate, incomplete, or inexact supervision, collectively referred to as weak supervision. In this work, we present WSAUC, a unified framework for weakly supervised AUC optimization problems, which covers noisy label learning, positive-unlabeled learning, multi-instance learning, and semi-supervised learning scenarios. Within the WSAUC framework, we first frame the AUC optimization problems in various weakly supervised scenarios as a common formulation of minimizing the AUC risk on contaminated sets, and demonstrate that the empirical risk minimization problems are consistent with the true AUC. Then, we introduce a new type of partial AUC, specifically, the reversed partial AUC (rpAUC), which serves as a robust training objective for AUC maximization in the presence of contaminated labels. WSAUC offers a universal solution for AUC optimization in various weakly supervised scenarios by maximizing the empirical rpAUC. Theoretical and experimental results under multiple settings support the effectiveness of WSAUC on a range of weakly supervised AUC optimization tasks.
arxiv情報
著者 | Zheng Xie,Yu Liu,Hao-Yuan He,Ming Li,Zhi-Hua Zhou |
発行日 | 2023-05-23 17:11:33+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google