要約
ディープ クラスタリングは、データセットを事前定義された数のグループに分割するフラット モデルによって支配されてきました。
最近の手法は、一般的なベンチマークのグラウンド トゥルースとの極めて高い類似性を達成していますが、フラット パーティションに含まれる情報は限られています。
この論文では、一般的な画像データに適用できる、ディープ ニューラル ネットワークに基づくコントラスト階層クラスタリング モデルである CoHiClust を紹介します。
CoHiClust は、自己教師あり学習アプローチを採用することにより、ラベル付きデータにアクセスせずにベース ネットワークをバイナリ ツリーに抽出します。
階層クラスタリング構造は、クラスター間の関係を分析したり、データ ポイント間の類似性を測定したりするために使用できます。
実験では、CoHiClust が、私たちの直感や画像のセマンティクスと一致する合理的なクラスター構造を生成することを示しています。
さらに、最先端のフラット クラスタリング モデルと比較して、ほとんどの画像データセットで優れたクラスタリング精度が得られます。
要約(オリジナル)
Deep clustering has been dominated by flat models, which split a dataset into a predefined number of groups. Although recent methods achieve an extremely high similarity with the ground truth on popular benchmarks, the information contained in the flat partition is limited. In this paper, we introduce CoHiClust, a Contrastive Hierarchical Clustering model based on deep neural networks, which can be applied to typical image data. By employing a self-supervised learning approach, CoHiClust distills the base network into a binary tree without access to any labeled data. The hierarchical clustering structure can be used to analyze the relationship between clusters, as well as to measure the similarity between data points. Experiments demonstrate that CoHiClust generates a reasonable structure of clusters, which is consistent with our intuition and image semantics. Moreover, it obtains superior clustering accuracy on most of the image datasets compared to the state-of-the-art flat clustering models.
arxiv情報
著者 | Michał Znaleźniak,Przemysław Rola,Patryk Kaszuba,Jacek Tabor,Marek Śmieja |
発行日 | 2023-06-21 16:37:11+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google