要約
我々は、半教師あり学習における擬似ラベル選択(PLS)の堅牢な基準として最近提案された、ソフトリビジョンを備えたガンマ・マキシミン法の理論的および計算的調査を提供します。
PLS の従来の方法とは対照的に、認識論的モデリングの不確実性を表すために、事前確率のクレダル セット (「一般化ベイズ」) を使用します。
これらの後者は、ソフト リビジョンを備えたガンマ マキシミン法によって更新されます。
最終的には、更新された資格セットから最も好ましくない分布を考慮して、可能性が最も高い擬似ラベル付きデータを選択します。
私たちは、最適な擬似ラベル付きデータを見つけるタスクを形式化します。
最適化問題としてソフト リビジョンを使用したガンマ マキシミン法。
ロジスティック モデルのクラスを具体的に実装すると、その方法の予測力を競合するアプローチと比較できるようになります。
ソフトリビジョンを使用したガンマ マキシミン法は、特にラベル付けされたデータの割合が低い場合に、非常に有望な結果を達成できることが観察されています。
要約(オリジナル)
We provide a theoretical and computational investigation of the Gamma-Maximin method with soft revision, which was recently proposed as a robust criterion for pseudo-label selection (PLS) in semi-supervised learning. Opposed to traditional methods for PLS we use credal sets of priors (‘generalized Bayes’) to represent the epistemic modeling uncertainty. These latter are then updated by the Gamma-Maximin method with soft revision. We eventually select pseudo-labeled data that are most likely in light of the least favorable distribution from the so updated credal set. We formalize the task of finding optimal pseudo-labeled data w.r.t. the Gamma-Maximin method with soft revision as an optimization problem. A concrete implementation for the class of logistic models then allows us to compare the predictive power of the method with competing approaches. It is observed that the Gamma-Maximin method with soft revision can achieve very promising results, especially when the proportion of labeled data is low.
arxiv情報
著者 | Stefan Dietrich,Julian Rodemann,Christoph Jansen |
発行日 | 2024-06-04 15:28:34+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google