PUAL: A Classifier on Trifurcate Positive-Unlabeled Data

要約

ラベルなし陽性 (PU) 学習は、ラベル付き陽性インスタンスとラベルなしインスタンスのみを含むデータを使用して分類器をトレーニングすることを目的としています。
ただし、既存の PU 学習方法では、正のインスタンスが負のインスタンスの両側に分布する三分岐データに対して満足のいくパフォーマンスを達成するのは一般に困難です。
この問題に対処するために、まず、正のインスタンスでの非対称損失の構造をグローバルおよびローカル学習分類器の目的関数に導入することにより、非対称損失を伴う PU 分類器 (PUAL) を提案します。
次に、PUAL が非線形の決定境界を取得できるようにするカーネル ベースのアルゴリズムを開発します。
シミュレーション データセットと現実世界のデータセットの両方での実験を通じて、PUAL が三分岐データで満足のいく分類を達成できることを示します。

要約(オリジナル)

Positive-unlabeled (PU) learning aims to train a classifier using the data containing only labeled-positive instances and unlabeled instances. However, existing PU learning methods are generally hard to achieve satisfactory performance on trifurcate data, where the positive instances distribute on both sides of the negative instances. To address this issue, firstly we propose a PU classifier with asymmetric loss (PUAL), by introducing a structure of asymmetric loss on positive instances into the objective function of the global and local learning classifier. Then we develop a kernel-based algorithm to enable PUAL to obtain non-linear decision boundary. We show that, through experiments on both simulated and real-world datasets, PUAL can achieve satisfactory classification on trifurcate data.

arxiv情報

著者 Xiaoke Wang,Xiaochen Yang,Rui Zhu,Jing-Hao Xue
発行日 2024-05-31 16:18:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク