要約
正のラベルなし学習は、正のラベルなしデータを使用したバイナリ分類問題です。
これは、医療やパーソナライズされた広告など、ネガティブ ラベルを取得するのに費用がかかるか不可能な領域でよく見られます。
局所的に精製された状態テンソル ネットワークを正のラベルなし学習問題に適用し、MNIST 画像と 15 のカテゴリ/混合データセットでモデルをテストします。
MNIST データセットでは、ラベル付きの陽性サンプルが非常に少ない場合でも、最先端の結果が得られます。
同様に、カテゴリ データセットの最先端技術を大幅に改善します。
さらに、ラベル付けされていないサンプルの異なるモデルの出力間の一致率は、モデルのパフォーマンスの良い指標であることを示しています。
最後に、私たちの方法は、単純な合成データセットで実証する新しい正と負のインスタンスを生成できます。
要約(オリジナル)
Positive unlabeled learning is a binary classification problem with positive and unlabeled data. It is common in domains where negative labels are costly or impossible to obtain, e.g., medicine and personalized advertising. We apply the locally purified state tensor network to the positive unlabeled learning problem and test our model on the MNIST image and 15 categorical/mixed datasets. On the MNIST dataset, we achieve state-of-the-art results even with very few labeled positive samples. Similarly, we significantly improve the state-of-the-art on categorical datasets. Further, we show that the agreement fraction between outputs of different models on unlabeled samples is a good indicator of the model’s performance. Finally, our method can generate new positive and negative instances, which we demonstrate on simple synthetic datasets.
arxiv情報
著者 | Bojan Žunkovič |
発行日 | 2022-11-25 13:14:33+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google