GLCC: A General Framework for Graph-Level Clustering

要約

この論文では、グラフレベルのクラスタリングの問題を研究しています。これは、斬新でありながら挑戦的なタスクです。
この問題は、バイオインフォマティクスにおけるタンパク質クラスタリングやゲノム解析など、さまざまな実世界のアプリケーションで重要です。
近年、グラフ ニューラル ネットワーク (GNN) と組み合わせたディープ クラスタリングの成功が目撃されています。
ただし、既存の方法は、単一のグラフが与えられたノード間のクラスタリングに焦点を当てていますが、複数のグラフでのクラスタリングの調査はまだ調査されていません。
この論文では、複数のグラフが与えられたときに、Graph-Level Contrastive Clustering (GLCC) という名前の一般的なグラフ レベル クラスタリング フレームワークを提案します。
具体的には、GLCC は最初にアダプティブ アフィニティ グラフを構築して、インスタンス レベルおよびクラスター レベルの対照学習 (CL) を調べます。
インスタンス レベルの CL は、グラフ ラプラシアン ベースの対比損失を利用して、クラスタリングに適した表現を学習します。クラスター レベルの CL は、各サンプルの近隣情報を組み込んだ識別可能なクラスター表現をキャプチャします。
さらに、表現学習の最適化に報酬を与えるために、近隣認識疑似ラベルを利用します。
2 つのステップは、協力して互いに利益をもたらすようにトレーニングすることもできます。
さまざまなよく知られているデータセットでの実験は、競合するベースラインに対する提案されたGLCCの優位性を示しています。

要約(オリジナル)

This paper studies the problem of graph-level clustering, which is a novel yet challenging task. This problem is critical in a variety of real-world applications such as protein clustering and genome analysis in bioinformatics. Recent years have witnessed the success of deep clustering coupled with graph neural networks (GNNs). However, existing methods focus on clustering among nodes given a single graph, while exploring clustering on multiple graphs is still under-explored. In this paper, we propose a general graph-level clustering framework named Graph-Level Contrastive Clustering (GLCC) given multiple graphs. Specifically, GLCC first constructs an adaptive affinity graph to explore instance- and cluster-level contrastive learning (CL). Instance-level CL leverages graph Laplacian based contrastive loss to learn clustering-friendly representations while cluster-level CL captures discriminative cluster representations incorporating neighbor information of each sample. Moreover, we utilize neighbor-aware pseudo-labels to reward the optimization of representation learning. The two steps can be alternatively trained to collaborate and benefit each other. Experiments on a range of well-known datasets demonstrate the superiority of our proposed GLCC over competitive baselines.

arxiv情報

著者 Wei Ju,Yiyang Gu,Binqi Chen,Gongbo Sun,Yifang Qin,Xingyuming Liu,Xiao Luo,Ming Zhang
発行日 2023-03-08 13:45:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.IR, cs.LG, cs.SI パーマリンク