Hyperbolic Category Discovery

要約

一般化されたカテゴリ発見(GCD)は、注目を集めている興味深いオープンワールドの問題です。
ラベル付き画像と非標識画像の両方を含むデータセットが与えられた場合、GCDは、既知のクラスまたは不明なクラスに属しているかどうかに関係なく、非標識サブセット内のすべての画像を分類することを目指しています。
GCDでは、一般的な慣行には通常、ユークリッドまたは球状空間内で動作する自己監視された前ored骨骨の端に球状投影演算子を適用することが含まれます。
ただし、これらのスペースは両方とも、階層構造を持つサンプルをエンコードするために最適ではないことが示されています。
対照的に、双曲線空間は、半径と比較して指数関数的な体積の成長を示し、見られたカテゴリと目に見えないカテゴリの両方からサンプルの階層構造をキャプチャするのが本質的に強くなっています。
したがって、双曲線空間でのカテゴリディスカバリーチャレンジに取り組むことを提案します。
一般化された\ underline {c} ategory \ underline {d} iscoveryの階層認識表現と分類器を学習するための単純な\ underline {hyp} erbolicフレームワークであるHipcdを紹介します。
HYPCDは、まずバックボーンネットワークのユークリッド埋め込みスペースを双曲線空間に変換し、双曲線距離とサンプル間の角度の両方を考慮して、その後の表現と分類学習を促進します。
このアプローチは、GCDの既知のカテゴリから未知のカテゴリへの知識移転に特に役立ちます。
パブリックGCDベンチマークでLipCDを徹底的に評価し、さまざまなベースラインおよび最先端の方法に適用し、一貫して大幅な改善を達成します。

要約(オリジナル)

Generalized Category Discovery (GCD) is an intriguing open-world problem that has garnered increasing attention. Given a dataset that includes both labelled and unlabelled images, GCD aims to categorize all images in the unlabelled subset, regardless of whether they belong to known or unknown classes. In GCD, the common practice typically involves applying a spherical projection operator at the end of the self-supervised pretrained backbone, operating within Euclidean or spherical space. However, both of these spaces have been shown to be suboptimal for encoding samples that possesses hierarchical structures. In contrast, hyperbolic space exhibits exponential volume growth relative to radius, making it inherently strong at capturing the hierarchical structure of samples from both seen and unseen categories. Therefore, we propose to tackle the category discovery challenge in the hyperbolic space. We introduce HypCD, a simple \underline{Hyp}erbolic framework for learning hierarchy-aware representations and classifiers for generalized \underline{C}ategory \underline{D}iscovery. HypCD first transforms the Euclidean embedding space of the backbone network into hyperbolic space, facilitating subsequent representation and classification learning by considering both hyperbolic distance and the angle between samples. This approach is particularly helpful for knowledge transfer from known to unknown categories in GCD. We thoroughly evaluate HypCD on public GCD benchmarks, by applying it to various baseline and state-of-the-art methods, consistently achieving significant improvements.

arxiv情報

著者 Yuanpei Liu,Zhenqi He,Kai Han
発行日 2025-04-08 15:12:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク