Spectral Clustering for Directed Graphs via Likelihood Estimation on Stochastic Block Models

要約

グラフクラスタリングは、教師なし学習における基本的なタスクであり、実世界で広く応用されている。無向グラフに対するスペクトルクラスタリング法はよく確立されており、最小カット最適化コンセンサスによって導かれるが、有向グラフへの拡張は、辺の方向によってもたらされる追加の複雑性のため、比較的未解明である。本論文では、有向グラフのスペクトルクラスタリング・アルゴリズムの開発の指針として、確率ブロックモデルの統計的推論を活用する。具体的には、広く用いられている有向確率ブロックモデルの下での最尤推定を研究し、基礎となるコミュニティ構造と整合する大域的目的関数を導出する。さらに、そのスペクトル緩和の誤クラスタリング誤差の理論的上限を確立し、この緩和に基づいて、有向グラフに対する新しい自己適応的なスペクトルクラスタリング手法を導入する。合成データセットと実世界データセットを用いた広範な実験により、既存のベースラインに対する性能の大幅な向上を実証する。

要約(オリジナル)

Graph clustering is a fundamental task in unsupervised learning with broad real-world applications. While spectral clustering methods for undirected graphs are well-established and guided by a minimum cut optimization consensus, their extension to directed graphs remains relatively underexplored due to the additional complexity introduced by edge directions. In this paper, we leverage statistical inference on stochastic block models to guide the development of a spectral clustering algorithm for directed graphs. Specifically, we study the maximum likelihood estimation under a widely used directed stochastic block model, and derive a global objective function that aligns with the underlying community structure. We further establish a theoretical upper bound on the misclustering error of its spectral relaxation, and based on this relaxation, introduce a novel, self-adaptive spectral clustering method for directed graphs. Extensive experiments on synthetic and real-world datasets demonstrate significant performance gains over existing baselines.

arxiv情報

著者 Ning Zhang,Xiaowen Dong,Mihai Cucuringu
発行日 2025-06-03 17:00:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, cs.SI, math.ST, stat.ML, stat.TH パーマリンク