Rethinking Open-World Semi-Supervised Learning: Distribution Mismatch and Inductive Inference

要約

オープンワールド半教師あり学習 (OWSSL) は、ラベルのないデータセット内の新しいカテゴリを考慮することにより、従来の半教師あり学習をオープンワールドのシナリオに拡張します。
OWSSL の最近の進歩にも関わらず、その成功は、1) ラベル付きデータセットとラベルなしデータセットが同じバランスのとれたクラス事前分布を共有する (現実世界のアプリケーションでは一般に当てはまらない)、および 2) ラベルなしトレーニング データセットが評価に利用されるという前提に依存することがよくあります。
このような変換的推論では、実際の課題に適切に対処できない可能性があります。
このペーパーでは、これらに対処することで OWSSL を一般化することを目的としています。
私たちの研究は、実際の OWSSL には、既存の文献で一般的であるものとは異なるトレーニング設定、評価方法、学習戦略が必要になる可能性があることを示唆しています。

要約(オリジナル)

Open-world semi-supervised learning (OWSSL) extends conventional semi-supervised learning to open-world scenarios by taking account of novel categories in unlabeled datasets. Despite the recent advancements in OWSSL, the success often relies on the assumptions that 1) labeled and unlabeled datasets share the same balanced class prior distribution, which does not generally hold in real-world applications, and 2) unlabeled training datasets are utilized for evaluation, where such transductive inference might not adequately address challenges in the wild. In this paper, we aim to generalize OWSSL by addressing them. Our work suggests that practical OWSSL may require different training settings, evaluation methods, and learning strategies compared to those prevalent in the existing literature.

arxiv情報

著者 Seongheon Park,Hyuk Kwon,Kwanghoon Sohn,Kibok Lee
発行日 2024-05-31 14:21:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク