要約
コミュニティ検出は、さまざまな分野で広範なアプリケーションを持つネットワーク サイエンスの古典的な問題です。
最も一般的に使用される方法は、ネットワーク ノードのさまざまなパーティションでコミュニティへのモジュール性を最大化するように設計されたアルゴリズムです。
幅広いコンテキストから 80 の実ネットワークとランダム ネットワークを使用して、現在のヒューリスティック モジュール性最大化アルゴリズムがモジュール性最大 (最適) パーティションを返すことに成功する範囲を調査します。
(1)各入力グラフの最大モジュール性に対する出力モジュール性の比率、および(2)出力パーティションとそのグラフの最適パーティション間の最大類似性を評価します。
私たちの計算実験には、モジュール性をグローバルに最大化する正確な整数計画法と比較する 8 つの既存のヒューリスティック アルゴリズムが含まれます。
平均的なモジュール性に基づくヒューリスティック アルゴリズムは、考慮された 80 個のグラフの 16.9% に対してのみ最適なパーティションを返します。
調整された相互情報量の結果は、実験でのグラフの準最適なパーティションと最適なパーティションとの間にかなりの相違があることを示しています。
さらに重要なことに、我々の結果は、最適に近いパーティションは、最適なパーティションと不均衡に似ていない傾向があることを示しています。
まとめると、私たちの分析は、コミュニティを発見するために一般的に使用されるモジュール性ベースのアルゴリズムの重大な制限を示しています。最適なパーティションまたは最適なパーティションに似たパーティションを返すことはめったにありません。
この発見を考えると、モジュール性を最大化するための正確なアルゴリズムまたは近似アルゴリズムを開発することは、コミュニティ検出におけるモジュール性のより方法論的に適切な使用法として推奨されます。
要約(オリジナル)
Community detection is a classic problem in network science with extensive applications in various fields. The most commonly used methods are the algorithms designed to maximize modularity over different partitions of the network nodes into communities. Using 80 real and random networks from a wide range of contexts, we investigate the extent to which current heuristic modularity maximization algorithms succeed in returning modularity-maximum (optimal) partitions. We evaluate (1) the ratio of their output modularity to the maximum modularity for each input graph and (2) the maximum similarity between their output partition and any optimal partition of that graph. Our computational experiments involve eight existing heuristic algorithms which we compare against an exact integer programming method that globally maximizes modularity. The average modularity-based heuristic algorithm returns optimal partitions for only 16.9% of the 80 graphs considered. Results on adjusted mutual information show considerable dissimilarity between the sub-optimal partitions and any optimal partitions of the graphs in our experiments. More importantly, our results show that near-optimal partitions tend to be disproportionally dissimilar to any optimal partition. Taken together, our analysis points to a crucial limitation of commonly used modularity-based algorithms for discovering communities: they rarely return an optimal partition or a partition resembling an optimal partition. Given this finding, developing an exact or approximate algorithm for modularity maximization is recommendable for a more methodologically sound usage of modularity in community detection.
arxiv情報
著者 | Samin Aref,Mahdi Mostajabdaveh,Hriday Chheda |
発行日 | 2023-02-28 16:11:08+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google