CiPR: An Efficient Framework with Cross-instance Positive Relations for Generalized Category Discovery

要約

タイトル:一般化されたカテゴリ発見のための交差インスタンスポジティブ関係を備えた効率的なフレームワークCiPR

要約:

– 一般化されたカテゴリ発見の問題に対処する。
– GCDは、部分的にラベル付けされたデータセットを自動クラスタリングする開かれた世界の問題を考慮するもので、未ラベルのデータには新しいカテゴリとラベルのついたクラスのインスタンスが含まれる。
– 未ラベルのデータには既知のカテゴリ数がない場合にGCD問題を解決するために、CiPRというフレームワークを提案する。
– CiPRは、既存の方法では無視されている部分的にラベル付けされたデータで対照的な学習のために交差インスタンスポジティブ関係を利用して表現をブートストラップすることを提案する。
– 信頼性の高い交差インスタンス関係を得るために、選択的隣接クラスタリング(SNC)というセミ監督階層型クラスタリングアルゴリズムを導入する。
– SNCは、隣接するコンポーネントから直接クラスタリング階層を生成することができる。また、与えられたクラス数で未ラベルインスタンスにラベルを付けることができるように、SNCを拡張する。
– さらに、ラベル付きデータと未ラベルデータのクラスタリング指標を考慮したジョイント参照スコアでSNCを使用して不明なクラス数を推定する方法を提示する。
– 最後に、パブリック一般的な画像認識データセットと難解なファイングレードデータセットでフレームワークを徹底的に評価し、新しい最先端技術を確立する。

要約(オリジナル)

We tackle the issue of generalized category discovery (GCD). GCD considers the open-world problem of automatically clustering a partially labelled dataset, in which the unlabelled data contain instances from novel categories and also the labelled classes. In this paper, we address the GCD problem without a known category number in the unlabelled data. We propose a framework, named CiPR, to bootstrap the representation by exploiting Cross-instance Positive Relations for contrastive learning in the partially labelled data which are neglected in existing methods. First, to obtain reliable cross-instance relations to facilitate the representation learning, we introduce a semi-supervised hierarchical clustering algorithm, named selective neighbor clustering (SNC), which can produce a clustering hierarchy directly from the connected components in the graph constructed by selective neighbors. We also extend SNC to be capable of label assignment for the unlabelled instances with the given class number. Moreover, we present a method to estimate the unknown class number using SNC with a joint reference score considering clustering indexes of both labelled and unlabelled data. Finally, we thoroughly evaluate our framework on public generic image recognition datasets and challenging fine-grained datasets, all establishing the new state-of-the-art.

arxiv情報

著者 Shaozhe Hao,Kai Han,Kwan-Yee K. Wong
発行日 2023-04-14 05:25:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.CV パーマリンク