要約
グラフニューラルネットワーク(GNN)は、グラフ構造という強力で表現力豊かなデータ表現に対して関数学習を行うことができるため、あらゆる機械学習タスクに適したツールである。教師なしタスクであるコミュニティの検出は、GNNを使用して行われることが多くなっています。グラフの接続性を持つノード特徴の多次元性を利用したグラフ内のノードのクラスタリングは、ソーシャルネットワークからゲノミクスまで、実世界のタスクに多くの応用があります。しかし、残念ながら、GNNを用いたコミュニティ検出を公正かつ厳密に評価するための十分なベンチマーク環境が確立されておらず、この新しい分野の進歩を阻害する可能性があるため、現在のところ、文献上のギャップがある。このような状況下で特に困難なのは、曖昧なハイパーパラメータチューニング環境と、相反する性能指標や評価データセットであると我々は考えている。本研究では、GNNを用いたコミュニティ検出アルゴリズムの一貫した比較のためのフレームワークを提案・評価する。これにより、GNNの使用やタスクの教師なし性質などの要因によって悪化した、実験設定に対する性能の強い依存性を示し、この分野での一致した研究を促進するためのフレームワークを使用する明確な動機を提供する。
要約(オリジナル)
Graph Neural Networks (GNNs) are a pertinent tool for any machine learning task due to their ability to learn functions over graph structures, a powerful and expressive data representation. The detection of communities, an unsupervised task has increasingly been performed with GNNs. Clustering nodes in a graph using the multi-dimensionality of node features with the connectivity of the graph has many applications to real world tasks from social networks to genomics. Unfortunately, there is currently a gap in the literature with no established sufficient benchmarking environment for fairly and rigorously evaluating GNN based community detection, thereby potentially impeding progress in this nascent field. We observe the particular difficulties in this setting is the ambiguous hyperparameter tuning environments combined with conflicting metrics of performance and evaluation datasets. In this work, we propose and evaluate frameworks for the consistent comparisons of community detection algorithms using GNNs. With this, we show the strong dependence of the performance to the experimental settings, exacerbated by factors such as the use of GNNs and the unsupervised nature of the task, providing clear motivation for the use of a framework to facilitate congruent research in the field.
arxiv情報
著者 | Will Leeney,Ryan McConville |
発行日 | 2023-05-12 08:47:40+00:00 |
arxivサイト | arxiv_id(pdf) |