SiMilarity-Enhanced Homophily for Multi-View Heterophilous Graph Clustering

要約

グラフ構造化データの普及に伴い、マルチビューグラフクラスタリングは様々な下流アプリケーションで広く使用されている。既存のアプローチは主に、クラスタリング性能を大幅に向上させる統一的なメッセージパッシング機構に依存している。とはいえ、このメカニズムは、基本的に同類性(homophily)、すなわち、接続されたノードが同じクラスに属することが多いという仮定を前提としているため、異類性の状況への適用には限界がある。現実には、この仮定が常に成り立つとは限らない。グラフ内の必然的な異質な情報により、完全に同質なグラフよりも、中程度あるいは軽度の同質なグラフの方が一般的である。この問題に対処するため、本論文では、SiMilarity-enhanced Homophily for Multi-view Heterophilous Graph Clustering (SMHGC)という新しいアプローチを提案する。類似度とグラフホモフィリーの関係を分析することで、ラベルフリーな方法で3つの類似度項、すなわち、近傍パターン類似度、ノード特徴類似度、マルチビューグローバル類似度を導入することで、ホモフィリーを強化することを提案する。次に、コンセンサスに基づくビュー間・ビュー内融合パラダイムを提案し、異なるビューからの改善された同類グラフを融合し、クラスタリングに利用する。マルチビューヘテロフィラスグラフとホモフィラスグラフの両データセットにおける最先端の実験結果は、教師なしマルチビューヘテロフィラスグラフ学習における類似性の強力な能力を実証している。さらに、同類性のレベルが異なる半合成データセット間で一貫した性能が得られたことは、SMHGCが異類性に強いことのさらなる証拠となる。

要約(オリジナル)

With the increasing prevalence of graph-structured data, multi-view graph clustering has been widely used in various downstream applications. Existing approaches primarily rely on a unified message passing mechanism, which significantly enhances clustering performance. Nevertheless, this mechanism limits its applicability to heterophilous situations, as it is fundamentally predicated on the assumption of homophily, i.e., the connected nodes often belong to the same class. In reality, this assumption does not always hold; a moderately or even mildly homophilous graph is more common than a fully homophilous one due to inevitable heterophilous information in the graph. To address this issue, in this paper, we propose a novel SiMilarity-enhanced Homophily for Multi-view Heterophilous Graph Clustering (SMHGC) approach. By analyzing the relationship between similarity and graph homophily, we propose to enhance the homophily by introducing three similarity terms, i.e., neighbor pattern similarity, node feature similarity, and multi-view global similarity, in a label-free manner. Then, a consensus-based inter- and intra-view fusion paradigm is proposed to fuse the improved homophilous graph from different views and utilize them for clustering. The state-of-the-art experimental results on both multi-view heterophilous and homophilous datasets collectively demonstrate the strong capacity of similarity for unsupervised multi-view heterophilous graph learning. Additionally, the consistent performance across semi-synthetic datasets with varying levels of homophily serves as further evidence of SMHGC’s resilience to heterophily.

arxiv情報

著者 Jianpeng Chen,Yawen Ling,Yazhou Ren,Zichen Wen,Tianyi Wu,Shufei Zhang,Lifang He
発行日 2024-10-04 16:55:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI パーマリンク