要約
ラベル付けされていないデータの性質を考慮すると、部分的にラベル付けされたトレーニングデータセットには、新しいカテゴリに属するサンプルが含まれているのが一般的です。
これらのいわゆる観測された新規カテゴリはトレーニングデータに存在しますが、どのトレーニングラベルにも属していません。
対照的に、オープンセットは、トレーニング中には観察されないが、テスト中には存在する新しいカテゴリを定義します。
この研究は、ラベルのないデータまたはオープンLACUを活用することにより、拡張カテゴリを使用したオープンセット学習と呼ばれる新しい学習ポリシー内で、観察された新しいカテゴリと観察されなかった新しいカテゴリを一般化した最初の研究です。
本研究では、観察された新規カテゴリーに関係する研究分野と、観察されていない新規カテゴリーに関係する研究分野を区別するために、新規性の検出に関するハイレベルなレビューを実施します。
次に、Open-LACUは、単一の学習ポリシー内でそれぞれの利点を維持するために、関連するフィールドの統合として導入されます。
現在、このプレプリントと組み合わせて発行する最初のオープンLACUネットワークを完成させています。
要約(オリジナル)
Considering the nature of unlabelled data, it is common for partially labelled training datasets to contain samples that belong to novel categories. Although these so-called observed novel categories exist in the training data, they do not belong to any of the training labels. In contrast, open-sets define novel categories as those unobserved during during training, but present during testing. This research is the first to generalize between observed and unobserved novel categories within a new learning policy called open-set learning with augmented category by exploiting unlabeled data or open-LACU. This study conducts a high-level review on novelty detection so to differentiate between research fields that concern observed novel categories, and the research fields that concern unobserved novel categories. Open-LACU is then introduced as a synthesis of the relevant fields to maintain the advantages of each within a single learning policy. Currently, we are finalising the first open-LACU network which will be combined with this pre-print to be sent for publication.
arxiv情報
著者 | Emile R. Engelbrecht,Johan A. du Preez |
発行日 | 2022-07-13 17:52:38+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google