Optimal Inference in Contextual Stochastic Block Models


文脈的確率ブロック モデル (cSBM) は、グラフと高次元ノード情報の両方がノード ラベルと相関する、属性付きグラフ上の教師なしコミュニティ検出のために提案されました。
グラフ上の機械学習のコンテキストでは、cSBM は、半教師ありノード分類のためのグラフ ニューラル ネットワーク (GNN) のパフォーマンスを評価するための合成データセットとして広く使用されています。
推論問題の確率的ベイズ最適定式化を検討し、半教師あり cSBM のための信念伝播ベースのアルゴリズムを導き出します。
このアルゴリズムによって達成される精度と、文献で提案されている GNN アーキテクチャのパフォーマンスの間には、かなりのギャップがある可能性があることを示します。
これは、cSBM が、実装を通じて容易にアクセスできる最適なアルゴリズムのパフォーマンスとの比較とともに、よりパフォーマンスの高い GNN アーキテクチャの開発に役立つ可能性があることを示唆しています。


The contextual stochastic block model (cSBM) was proposed for unsupervised community detection on attributed graphs where both the graph and the high-dimensional node information correlate with node labels. In the context of machine learning on graphs, the cSBM has been widely used as a synthetic dataset for evaluating the performance of graph-neural networks (GNNs) for semi-supervised node classification. We consider a probabilistic Bayes-optimal formulation of the inference problem and we derive a belief-propagation-based algorithm for the semi-supervised cSBM; we conjecture it is optimal in the considered setting and we provide its implementation. We show that there can be a considerable gap between the accuracy reached by this algorithm and the performance of the GNN architectures proposed in the literature. This suggests that the cSBM, along with the comparison to the performance of the optimal algorithm, readily accessible via our implementation, can be instrumental in the development of more performant GNN architectures.


著者 O. Duranthon,L. Zdeborová
発行日 2024-03-05 16:09:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.SI パーマリンク