A parameterised model for link prediction using node centrality and similarity measure based on graph embedding

要約

リンク予測はグラフ機械学習の重要な側面であり、病気の予測、ソーシャル ネットワークの推奨事項、創薬などさまざまな用途に使用されます。
これには、ネットワーク ノード間に形成される可能性のある新しいリンクの予測が含まれます。
リンク予測の重要性は明らかですが、既存のモデルには重大な欠点があります。
たとえば、グラフ畳み込みネットワークは、さまざまなデータセットのリンク予測において非常に効率的であることが証明されています。
ただし、ショートパス ネットワークやエゴ ネットワークに適用すると厳しい制限が発生し、パフォーマンスが低下します。
これは、この研究が取り組むことを目的とする重大な問題領域を示しています。
このペーパーでは、リンク予測タスクの新しい方法であるノード中心性と類似性に基づくパラメーター化モデル (NCSM) を紹介します。
NCSM は、ノードの中心性と類似性の測定をカスタマイズされたグラフ ニューラル ネットワーク (GNN) レイヤーのエッジ機能として独自に統合し、大規模ネットワークのトポロジー情報を効果的に活用します。
このモデルは、トポロジー情報を考慮した最初のパラメーター化された GNN ベースのリンク予測モデルを表します。
提案されたモデルは、それぞれ数千のノードとエッジで構成される 5 つのベンチマーク グラフ データセットで評価されました。
実験結果は、グラフ畳み込みネットワークや変分グラフ オートエンコーダーなどの既存の最先端モデルに対する NCSM の優位性を強調しており、さまざまなメトリクスやデータセットにわたって優れたパフォーマンスを発揮します。
この卓越したパフォーマンスは、NCSM のノードの中心性、類似性の測定、およびトポロジー情報の効率的な使用の革新的な統合に起因すると考えられます。

要約(オリジナル)

Link prediction is a key aspect of graph machine learning, with applications as diverse as disease prediction, social network recommendations, and drug discovery. It involves predicting new links that may form between network nodes. Despite the clear importance of link prediction, existing models have significant shortcomings. Graph Convolutional Networks, for instance, have been proven to be highly efficient for link prediction on a variety of datasets. However, they encounter severe limitations when applied to short-path networks and ego networks, resulting in poor performance. This presents a critical problem space that this work aims to address. In this paper, we present the Node Centrality and Similarity Based Parameterised Model (NCSM), a novel method for link prediction tasks. NCSM uniquely integrates node centrality and similarity measures as edge features in a customised Graph Neural Network (GNN) layer, effectively leveraging the topological information of large networks. This model represents the first parameterised GNN-based link prediction model that considers topological information. The proposed model was evaluated on five benchmark graph datasets, each comprising thousands of nodes and edges. Experimental results highlight NCSM’s superiority over existing state-of-the-art models like Graph Convolutional Networks and Variational Graph Autoencoder, as it outperforms them across various metrics and datasets. This exceptional performance can be attributed to NCSM’s innovative integration of node centrality, similarity measures, and its efficient use of topological information.

arxiv情報

著者 Haohui Lu,Shahadat Uddin
発行日 2023-09-11 13:13:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.SI パーマリンク