RDSA: A Robust Deep Graph Clustering Framework via Dual Soft Assignment

要約

グラフクラスタリングは、ノードを個別のクラスターにグループ化することを含むネットワーク分析の重要な側面です。
深い学習の最近の開発により、多くのアプリケーションで効果的であることが証明されているグラフクラスタリングが生じています。
それにもかかわらず、これらの方法は、特に騒々しいエッジの存在下で、実際のグラフを扱うときに困難に遭遇することがよくあります。
さらに、多くの除去グラフクラスタリング方法は、非異数のモデルと比較して、パフォーマンスの低下、トレーニング不安定性、および大規模なデータセットへのスケーリングにおける課題に悩まされる傾向があります。
これらの問題に取り組むために、デュアルソフト割り当て(RDSA)を介して、堅牢なディープグラフクラスタリングフレームワークと呼ばれる新しいフレームワークを紹介します。
RDSAは、3つの重要なコンポーネントで構成されています。(i)グラフのトポロジ機能とノード属性を効果的に統合するノード埋め込みモジュール。
(ii)ノード割り当てにアフィニティマトリックスを使用することによりグラフモジュール性を向上させる構造ベースのソフト割り当てモジュール。
(iii)コミュニティのランドマークを識別し、ノード割り当てを改良してモデルの堅牢性を高めるノードベースのソフト割り当てモジュール。
さまざまな現実世界のデータセットでRDSAを評価し、既存の最先端の方法に比べて優れたパフォーマンスを実証します。
私たちの調査結果は、RDSAがさまざまなグラフタイプにわたって堅牢なクラスタリングを提供し、ノイズ、安定性、スケーラビリティへの適応性を含むクラスタリングの有効性と堅牢性に優れていることを示しています。

要約(オリジナル)

Graph clustering is an essential aspect of network analysis that involves grouping nodes into separate clusters. Recent developments in deep learning have resulted in graph clustering, which has proven effective in many applications. Nonetheless, these methods often encounter difficulties when dealing with real-world graphs, particularly in the presence of noisy edges. Additionally, many denoising graph clustering methods tend to suffer from lower performance, training instability, and challenges in scaling to large datasets compared to non-denoised models. To tackle these issues, we introduce a new framework called the Robust Deep Graph Clustering Framework via Dual Soft Assignment (RDSA). RDSA consists of three key components: (i) a node embedding module that effectively integrates the graph’s topological features and node attributes; (ii) a structure-based soft assignment module that improves graph modularity by utilizing an affinity matrix for node assignments; and (iii) a node-based soft assignment module that identifies community landmarks and refines node assignments to enhance the model’s robustness. We assess RDSA on various real-world datasets, demonstrating its superior performance relative to existing state-of-the-art methods. Our findings indicate that RDSA provides robust clustering across different graph types, excelling in clustering effectiveness and robustness, including adaptability to noise, stability, and scalability.

arxiv情報

著者 Yang Xiang,Li Fan,Tulika Saha,Xiaoying Pang,Yushan Pan,Haiyang Zhang,Chengtao Ji
発行日 2025-02-17 16:26:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.IR, cs.LG パーマリンク