Deep Clustering with Self-Supervision using Pairwise Similarities


ディープクラスタリングは、クラスタリングに適切な低次元空間を見つけるために、クラスタリングに埋め込みを組み込む。本論文では、ペアワイズ類似度を用いた自己監視(self-supervision using pairwise similarities: DCSS)を用いた新しいディープクラスタリングフレームワークを提案する。提案手法は2つの連続したフェーズから構成される。最初のフェーズでは、クラスタ固有の損失を用いて訓練されたオートエンコーダを用いて、類似データ点のハイパースフィアのようなグループ、すなわち1クラスタにつき1つのハイパースフィアを形成することを提案する。超球はオートエンコーダの潜在空間に形成される。第2段階では,より複雑なクラスタ分布に対応できる$K$次元空間を作成するために,ペアワイズ類似度を採用することを提案し,より正確なクラスタリング性能を提供する.K$はクラスタ数である。第1フェーズで得られたオートエンコーダの潜在空間は、第2フェーズの入力として用いられる。両フェーズの有効性は、厳密な一連の実験を行うことにより、7つのベンチマークデータセットで実証される。


Deep clustering incorporates embedding into clustering to find a lower-dimensional space appropriate for clustering. In this paper, we propose a novel deep clustering framework with self-supervision using pairwise similarities (DCSS). The proposed method consists of two successive phases. In the first phase, we propose to form hypersphere-like groups of similar data points, i.e. one hypersphere per cluster, employing an autoencoder that is trained using cluster-specific losses. The hyper-spheres are formed in the autoencoder’s latent space. In the second phase, we propose to employ pairwise similarities to create a $K$-dimensional space that is capable of accommodating more complex cluster distributions, hence providing more accurate clustering performance. $K$ is the number of clusters. The autoencoder’s latent space obtained in the first phase is used as the input of the second phase. The effectiveness of both phases is demonstrated on seven benchmark datasets by conducting a rigorous set of experiments.


著者 Mohammadreza Sadeghi,Narges Armanfard
発行日 2024-05-06 16:01:28+00:00
arxiv_id(pdf)

