ポジティブおよびラベルなし (PU) 学習、半教師あり学習 (SSL)、およびオープンセット認識 (OSR) の統一されたアプローチは、コスト効率の高いアプリケーション グレードの分類器の開発を大幅に強化します。
ただし、これまでの試みでは、\mbox{\textit{observed}} と \mbox{\textit{unobserved}} の新規カテゴリの定義が混同されていました。
観測された新規カテゴリは、PU 学習ではラベルのないトレーニング データ内のカテゴリとして定義され、トレーニング セットのカテゴリ ラベルが不完全であるために存在します。
対照的に、OSR では、観測されていない新規カテゴリーは、テスト データ内にのみ存在し、時間の経過とともに出現する新しくて興味深いパターンを表すカテゴリーとして定義されます。
安全で実用的な分類器の開発を維持するには、モデルはこれらの新しいカテゴリ タイプ間の違いを一般化する必要があります。
このレターでは、関連する機械学習の研究分野を徹底的にレビューし、ラベルなしデータまたは Open-LACU を活用した、拡張カテゴリーによるオープンセット学習と呼ばれる新しい統合機械学習ポリシーを提案します。
具体的には、Open-LACU では、モデルが $K > 1$ 個のラベル付きカテゴリーを正確に分類すると同時に、観察された新規カテゴリーを検出して拡張背景カテゴリー ($K + 1$) に分離し、さらに観察されていない新規カテゴリーを検出して拡張背景カテゴリーに分離する必要があります。
不明なカテゴリ ($K + 2$)。
Open-LACU は、観測された新規カテゴリと観測されていない新規カテゴリを一般化する最初の機械学習ポリシーです。
また、Open-LACU の重要性は、リモート センシング画像のセマンティック セグメンテーション、医療放射線画像内の物体検出、咳音分析による病気の特定における応用について説明することによって強調されます。
A unified approach of Positive and Unlabelled (PU)-learning, Semi-Supervised Learning (SSL), and Open-Set Recognition (OSR) would significantly enhance the development of cost-efficient application-grade classifiers. However, previous attempts have conflated the definitions of \mbox{\textit{observed}} and \mbox{\textit{unobserved}} novel categories. Observed novel categories are defined in PU-learning as those in unlabelled training data and exist due to an incomplete set of category labels for the training set. In contrast, unobserved novel categories are defined in OSR as those that only exist in the testing data and represent new and interesting patterns that emerge over time. To maintain safe and practical classifier development, models must generalise the difference between these novel category types. In this letter, we thoroughly review the relevant machine learning research fields to propose a new unified machine learning policy called Open-set Learning with Augmented Categories by exploiting Unlabelled data or Open-LACU. Specifically, Open-LACU requires models to accurately classify $K > 1$ number of labelled categories while simultaneously detecting and separating observed novel categories into the augmented background category ($K + 1$) and further detecting and separating unobserved novel categories into the augmented unknown category ($K + 2$). Open-LACU is the first machine learning policy to generalise observed and unobserved novel categories. The significance of Open-LACU is also highlighted by discussing its application in semantic segmentation of remote sensing images, object detection within medical radiology images and disease identification through cough sound analysis.
著者 | Emile R. Engelbrecht,Johan A. du Preez |
発行日 | 2023-06-28 12:00:14+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google