要約
アクティブ ラーニング (AL) は、アノテーションのコストを削減するために、ラベルを付ける最も有益なサンプルを選択するための効果的なアプローチです。
既存の AL 手法は通常、閉集合の仮定の下で機能します。つまり、ラベルなしサンプル プールに存在するすべてのクラスはターゲット モデルによって分類される必要があります。
ただし、一部の実際の臨床タスクでは、ラベルのないプールには、きめ細かく分類する必要があるターゲット クラスだけでなく、臨床タスクに無関係な非ターゲット クラスも含まれる場合があります。
既存の AL メソッドは、多数の非ターゲット サンプルを選択する傾向があるため、このシナリオではうまく機能しません。
このペーパーでは、このシナリオをオープンセット AL 問題として定式化し、ターゲット クラスと非ターゲット クラスのサンプルの両方を含むラベルなしプールからサンプルをクエリするという課題に対処するための効率的なフレームワークである OpenAL を提案します。
病理画像の詳細な分類に関する実験では、OpenAL がターゲット クラス サンプルのクエリ品質を大幅に向上させ、現在の最先端の AL 手法よりも高いパフォーマンスを達成できることが示されています。
コードは https://github.com/miccaiif/OpenAL で入手できます。
要約(オリジナル)
Active learning (AL) is an effective approach to select the most informative samples to label so as to reduce the annotation cost. Existing AL methods typically work under the closed-set assumption, i.e., all classes existing in the unlabeled sample pool need to be classified by the target model. However, in some practical clinical tasks, the unlabeled pool may contain not only the target classes that need to be fine-grainedly classified, but also non-target classes that are irrelevant to the clinical tasks. Existing AL methods cannot work well in this scenario because they tend to select a large number of non-target samples. In this paper, we formulate this scenario as an open-set AL problem and propose an efficient framework, OpenAL, to address the challenge of querying samples from an unlabeled pool with both target class and non-target class samples. Experiments on fine-grained classification of pathology images show that OpenAL can significantly improve the query quality of target class samples and achieve higher performance than current state-of-the-art AL methods. Code is available at https://github.com/miccaiif/OpenAL.
arxiv情報
著者 | Linhao Qu,Yingfan Ma,Zhiwei Yang,Manning Wang,Zhijian Song |
発行日 | 2023-07-11 13:36:07+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google