要約
正のラベルなし学習は、正のラベルなしデータを持つ二値分類問題である。医療やパーソナライズド広告など、ネガティブラベルが高価であったり、入手不可能であったりする領域でよく見られるものである。我々は、局所的に精製された状態テンソルネットワークを正のラベルなし学習問題に適用し、MNIST画像と15のカテゴリ/混合データセットで我々のモデルをテストする。MNISTデータセットでは、ラベル付き正サンプルが非常に少ない場合でも、最先端技術に近い結果を得ることができた。また、カテゴリデータセットでは、最先端技術を大幅に向上させた。さらに、ラベルのないサンプルに対する異なるモデルの出力間の一致率が、モデルの性能の良い指標となることを示す。最後に、本手法は新しい正負のインスタンスを生成することができ、これを簡単な合成データセットで実証する。
要約(オリジナル)
Positive unlabeled learning is a binary classification problem with positive and unlabeled data. It is common in domains where negative labels are costly or impossible to obtain, e.g., medicine and personalized advertising. We apply the locally purified state tensor network to the positive unlabeled learning problem and test our model on the MNIST image and 15 categorical/mixed datasets. On the MNIST dataset, we obtain close to the state-of-the-art results even with very few labeled positive samples. We significantly improve the state-of-the-art on categorical datasets. Further, we show that the agreement fraction between outputs of different models on unlabeled samples is a good indicator of the model’s performance. Finally, our method can generate new positive and negative instances, which we demonstrate on simple synthetic datasets.
arxiv情報
著者 | Bojan Žunkovič |
発行日 | 2023-03-07 13:56:51+00:00 |
arxivサイト | arxiv_id(pdf) |