Deep Multi-View Subspace Clustering with Anchor Graph


Deep multi-view subspace clustering (DMVSC)は、その有望な性能により、最近注目度が高まっている。しかし、既存のDMVSC法には、(1)主にオートエンコーダを使用してデータを非線形に埋め込むことに焦点を当てているが、オートエンコーダではクラスタリング目的がほとんど考慮されないため、埋め込みはクラスタリングに最適でない可能性がある、(2)既存の方法は一般的に2次関数、あるいは3次関数の複雑さを持ち、大規模データを扱うのは困難である、という2つの問題が残っている。これらの問題に対処するため、本論文では、アンカーグラフを用いた新しい深層マルチビュー部分空間クラスタリング法(DMCAG)を提案する。具体的には、DMCAGはまず、各ビューの埋め込み特徴を独立して学習し、それを用いて部分空間表現を得る。複雑さを大幅に軽減するために、各ビューに対してサイズの小さいアンカーグラフを構築する。そして、統合されたアンカーグラフに対してスペクトルクラスタリングを行い、擬似ラベルを得る。最適でない埋め込み特徴による悪影響を克服するために、擬似ラベルを用いて埋め込みプロセスを改良し、クラスタリングタスクに適したものにする。擬似ラベルと埋め込み特徴量は交互に更新される。さらに、クラスタリング性能を向上させるために、対比学習に基づいてラベルの一貫性を保つ戦略を設計する。実世界のデータセットを用いた実証研究により、本手法が他の最先端手法よりも優れたクラスタリング性能を達成することが示された。


Deep multi-view subspace clustering (DMVSC) has recently attracted increasing attention due to its promising performance. However, existing DMVSC methods still have two issues: (1) they mainly focus on using autoencoders to nonlinearly embed the data, while the embedding may be suboptimal for clustering because the clustering objective is rarely considered in autoencoders, and (2) existing methods typically have a quadratic or even cubic complexity, which makes it challenging to deal with large-scale data. To address these issues, in this paper we propose a novel deep multi-view subspace clustering method with anchor graph (DMCAG). To be specific, DMCAG firstly learns the embedded features for each view independently, which are used to obtain the subspace representations. To significantly reduce the complexity, we construct an anchor graph with small size for each view. Then, spectral clustering is performed on an integrated anchor graph to obtain pseudo-labels. To overcome the negative impact caused by suboptimal embedded features, we use pseudo-labels to refine the embedding process to make it more suitable for the clustering task. Pseudo-labels and embedded features are updated alternately. Furthermore, we design a strategy to keep the consistency of the labels based on contrastive learning to enhance the clustering performance. Empirical studies on real-world datasets show that our method achieves superior clustering performance over other state-of-the-art methods.


著者 Chenhang Cui,Yazhou Ren,Jingyu Pu,Xiaorong Pu,Lifang He
発行日 2023-05-11 16:17:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, DeepL

カテゴリー: cs.LG パーマリンク