HMSN: Hyperbolic Self-Supervised Learning by Clustering with Ideal Prototypes

要約

視覚表現学習のための双曲多様体は、低次元表現空間内に歪みの少ないツリー状構造を自然に埋め込むことにより、意味クラス階層の効果的な学習を可能にします。
双曲学習によって生成される高度に分離可能な意味クラス階層は、ローショットタスクでは強力であることが示されていますが、自己教師あり学習への応用はまだ十分に検討されていません。
この研究では、プロトタイプベースのクラスタリングアプローチのための自己教師あり表現学習のための双曲表現空間の使用を検討します。
まず、双曲空間のポアンカレ球モデルで動作するようにマスクされたシャム ネットワークを拡張します。次に、ポアンカレ球の理想的な境界にプロトタイプを配置します。
以前の方法とは異なり、エンコーダ ネットワークの出力で双曲線空間に投影し、双曲線射影ヘッドを利用して、下流のタスクに使用される表現が双曲線のままであることを保証します。
我々は、これらの手法が、線形評価タスクについては低次元のユークリッド手法と比較して実行できることを経験的に実証し、極端な少数ショット学習タスクでは改善を示しました。

要約(オリジナル)

Hyperbolic manifolds for visual representation learning allow for effective learning of semantic class hierarchies by naturally embedding tree-like structures with low distortion within a low-dimensional representation space. The highly separable semantic class hierarchies produced by hyperbolic learning have shown to be powerful in low-shot tasks, however, their application in self-supervised learning is yet to be explored fully. In this work, we explore the use of hyperbolic representation space for self-supervised representation learning for prototype-based clustering approaches. First, we extend the Masked Siamese Networks to operate on the Poincar\’e ball model of hyperbolic space, secondly, we place prototypes on the ideal boundary of the Poincar\’e ball. Unlike previous methods we project to the hyperbolic space at the output of the encoder network and utilise a hyperbolic projection head to ensure that the representations used for downstream tasks remain hyperbolic. Empirically we demonstrate the ability of these methods to perform comparatively to Euclidean methods in lower dimensions for linear evaluation tasks, whilst showing improvements in extreme few-shot learning tasks.

arxiv情報

著者 Aiden Durrant,Georgios Leontidis
発行日 2023-05-18 12:38:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク