High-dimensional Clustering onto Hamiltonian Cycle

要約

タイトル:高次元クラスタリングにおけるハミルトンサイクルの上に

要約:
– クラスタリングは、類似性に基づいてラベルのないサンプルをグループ分けすることを目的としている。
– 高次元データの分析において、クラスタリングは重要なツールの一つになっているが、ほとんどのクラスタリング手法は疑似的なラベルを生成するため、異なるクラスタや外れ値の間の類似性を同時に表現することができない。
– 本論文では、この問題を解決するために、High-dimensional Clustering onto Hamiltonian Cycle (HCHC) という新しいフレームワークを提案している。
– まず、HCHCはグローバルな構造とローカルな構造を組み合わせた目的関数を使用して、深層クラスタリングにおいて相対確率として改善したラベルを生成し、異なるクラスタ間の類似性をマイニングしつつ、各クラスタのローカル構造を保持する。
– 次に、クラスタのアンカーをクラスタの類似性によって生成される最適なハミルトンサイクル上に並べ、円周上にマップする。
– 最後に、より高い確率でクラスタに属するサンプルは、対応するアンカーに近くマップされる。
– このように、HCHCフレームワークには、クラスタ(高い確率で形成されるサンプル)、クラスタ類似性(円周距離として表される)、および外れ値(すべてのクラスタから遠い点として認識される)の3つの視点を同時に認識できる。
– 実験結果は、HCHCの優越性を示している。

要約(オリジナル)

Clustering aims to group unlabelled samples based on their similarities. It has become a significant tool for the analysis of high-dimensional data. However, most of the clustering methods merely generate pseudo labels and thus are unable to simultaneously present the similarities between different clusters and outliers. This paper proposes a new framework called High-dimensional Clustering onto Hamiltonian Cycle (HCHC) to solve the above problems. First, HCHC combines global structure with local structure in one objective function for deep clustering, improving the labels as relative probabilities, to mine the similarities between different clusters while keeping the local structure in each cluster. Then, the anchors of different clusters are sorted on the optimal Hamiltonian cycle generated by the cluster similarities and mapped on the circumference of a circle. Finally, a sample with a higher probability of a cluster will be mapped closer to the corresponding anchor. In this way, our framework allows us to appreciate three aspects visually and simultaneously – clusters (formed by samples with high probabilities), cluster similarities (represented as circular distances), and outliers (recognized as dots far away from all clusters). The experiments illustrate the superiority of HCHC.

arxiv情報

著者 Tianyi Huang,Shenghui Cheng,Stan Z. Li,Zhengjun Zhang
発行日 2023-04-27 20:59:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI パーマリンク