GraphLearner: Graph Node Clustering with Fully Learnable Augmentation

要約

対照ディープ グラフ クラスタリング (CDGC) は、対照学習の力を利用してノードを異なるクラスターにグループ化します。
コントラストサンプルの品質はパフォーマンスを向上させるために非常に重要であり、増強技術がプロセスの重要な要素となります。
ただし、既存の手法における拡張サンプルは常に人間の経験によって事前定義されており、下流のタスクのクラスタリングに依存しないため、人的リソースのコストが高くつき、パフォーマンスの低下につながります。
これらの制限を克服するために、GraphLearner と呼ばれる、完全に学習可能な拡張を備えたグラフ ノード クラスタリングを提案します。
CDGC 用の高品質でタスク固有の拡張サンプルを生成するための学習可能な拡張子が導入されています。
GraphLearner には、属性および構造情報を取得するために特別に設計された 2 つの学習可能なオーグメンターが組み込まれています。
さらに、学習されたアフィニティ行列の信頼性を高めるために、高信頼擬似ラベル行列とクロスビューサンプル類似性行列を含む 2 つの改良行列を導入します。
トレーニング手順中に、学習可能なオーグメンターと対照的な学習ネットワークをトレーニングするための明確な最適化目標に気づきました。
言い換えれば、埋め込みの一貫性と拡張サンプルの多様性の両方を保証する必要があります。
この課題に対処するために、私たちはメソッド内で敵対的学習メカニズムを提案します。
さらに、2 段階のトレーニング戦略を活用して、信頼性の高い行列を改良します。
6 つのベンチマーク データセットに関する広範な実験結果により、GraphLearner の有効性が検証されています。GraphLearner のコードと付録は、Github の https://github.com/xihongyang1999/GraphLearner で入手できます。

要約(オリジナル)

Contrastive deep graph clustering (CDGC) leverages the power of contrastive learning to group nodes into different clusters. The quality of contrastive samples is crucial for achieving better performance, making augmentation techniques a key factor in the process. However, the augmentation samples in existing methods are always predefined by human experiences, and agnostic from the downstream task clustering, thus leading to high human resource costs and poor performance. To overcome these limitations, we propose a Graph Node Clustering with Fully Learnable Augmentation, termed GraphLearner. It introduces learnable augmentors to generate high-quality and task-specific augmented samples for CDGC. GraphLearner incorporates two learnable augmentors specifically designed for capturing attribute and structural information. Moreover, we introduce two refinement matrices, including the high-confidence pseudo-label matrix and the cross-view sample similarity matrix, to enhance the reliability of the learned affinity matrix. During the training procedure, we notice the distinct optimization goals for training learnable augmentors and contrastive learning networks. In other words, we should both guarantee the consistency of the embeddings as well as the diversity of the augmented samples. To address this challenge, we propose an adversarial learning mechanism within our method. Besides, we leverage a two-stage training strategy to refine the high-confidence matrices. Extensive experimental results on six benchmark datasets validate the effectiveness of GraphLearner.The code and appendix of GraphLearner are available at https://github.com/xihongyang1999/GraphLearner on Github.

arxiv情報

著者 Xihong Yang,Erxue Min,Ke Liang,Yue Liu,Siwei Wang,Sihang Zhou,Huijun Wu,Xinwang Liu,En Zhu
発行日 2024-08-06 15:56:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク