Mixture of multilayer stochastic block models for multiview clustering

要約

この研究では、異なる情報源から得られる複数のクラスタリングを集約するための独自の方法を提案します。
各パーティションは、観測間の共通メンバーシップ行列によってエンコードされます。
私たちのアプローチでは、多層確率ブロック モデル (SBM) の混合を使用して、同様の情報を持つ共有メンバーシップ行列をコンポーネントにグループ化し、コンポーネント内の特異性を考慮して観測値を異なるクラスターに分割します。
モデルパラメータの識別可能性が確立され、これらのパラメータの推定のために変分ベイジアンEMアルゴリズムが提案されます。
ベイジアン フレームワークを使用すると、最適な数のクラスターとコンポーネントを選択できます。
提案されたアプローチは、大規模で複雑なネットワークにおけるコミュニティ検出のためのコンセンサス クラスタリングとテンソル ベースのアルゴリズムを備えた合成データを使用して比較されます。
最後に、この方法を利用して世界的な食品取引ネットワークを分析し、関心のある構造を導き出します。

要約(オリジナル)

In this work, we propose an original method for aggregating multiple clustering coming from different sources of information. Each partition is encoded by a co-membership matrix between observations. Our approach uses a mixture of multilayer Stochastic Block Models (SBM) to group co-membership matrices with similar information into components and to partition observations into different clusters, taking into account their specificities within the components. The identifiability of the model parameters is established and a variational Bayesian EM algorithm is proposed for the estimation of these parameters. The Bayesian framework allows for selecting an optimal number of clusters and components. The proposed approach is compared using synthetic data with consensus clustering and tensor-based algorithms for community detection in large-scale complex networks. Finally, the method is utilized to analyze global food trading networks, leading to structures of interest.

arxiv情報

著者 Kylliann De Santiago,Marie Szafranski,Christophe Ambroise
発行日 2024-01-09 17:15:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.ST, stat.ML, stat.TH パーマリンク