要約
グラフ クラスタリングは、グラフ内のノードを互いに素なクラスターに分割することを含み、その後の多数のアプリケーションにとって非常に重要です。
最近、監視情報を利用することで知られる対照学習が、ディープ グラフ クラスタリングにおいて有望な結果を示しています。
この方法論は、表現空間内で正の相関があるノードのペアを引き付け、負の相関のあるペアを遠ざけることにより、クラスタリングに有利なノード表現の学習を容易にします。
それにもかかわらず、既存の方法の重大な制限は、ノードごとの類似性を徹底的に調査することが不十分であることです。
たとえば、ノード間の固有の意味関係を無視して、表現空間内のノード類似性行列が同一であると仮説を立てる人もいます。
クラスタリングにおけるインスタンス類似性の基本的な役割を考慮して、私たちの研究では、ノード類似性行列の観点から対照グラフ クラスタリングを調査します。
表現空間内の理想的なノード類似性行列は、ノード間の固有の意味的関係を正確に反映し、学習された表現における意味的類似性の保存を保証する必要があると主張します。
これに応えて、私たちは、表現空間内でほぼ理想的なノード類似度行列を推定して表現学習をガイドする新しいフレームワークである信頼性ノード類似度行列ガイド付き対照グラフ クラスタリング (NS4GC) を導入します。
私たちの方法では、ノード隣接アライメントとセマンティックを意識したスパース化を導入し、ノード類似性行列が正確で効率的にスパースであることを保証します。
8 ドルの実世界のデータセットに対して行われた包括的な実験により、ノード類似性行列の学習の有効性と NS4GC の優れたパフォーマンスが確認されました。
要約(オリジナル)
Graph clustering, which involves the partitioning of nodes within a graph into disjoint clusters, holds significant importance for numerous subsequent applications. Recently, contrastive learning, known for utilizing supervisory information, has demonstrated encouraging results in deep graph clustering. This methodology facilitates the learning of favorable node representations for clustering by attracting positively correlated node pairs and distancing negatively correlated pairs within the representation space. Nevertheless, a significant limitation of existing methods is their inadequacy in thoroughly exploring node-wise similarity. For instance, some hypothesize that the node similarity matrix within the representation space is identical, ignoring the inherent semantic relationships among nodes. Given the fundamental role of instance similarity in clustering, our research investigates contrastive graph clustering from the perspective of the node similarity matrix. We argue that an ideal node similarity matrix within the representation space should accurately reflect the inherent semantic relationships among nodes, ensuring the preservation of semantic similarities in the learned representations. In response to this, we introduce a new framework, Reliable Node Similarity Matrix Guided Contrastive Graph Clustering (NS4GC), which estimates an approximately ideal node similarity matrix within the representation space to guide representation learning. Our method introduces node-neighbor alignment and semantic-aware sparsification, ensuring the node similarity matrix is both accurate and efficiently sparse. Comprehensive experiments conducted on $8$ real-world datasets affirm the efficacy of learning the node similarity matrix and the superior performance of NS4GC.
arxiv情報
| 著者 | Yunhui Liu,Xinyi Gao,Tieke He,Tao Zheng,Jianhua Zhao,Hongzhi Yin |
| 発行日 | 2024-08-07 13:36:03+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google