Hierarchical Position Embedding of Graphs with Landmarks and Clustering for Link Prediction

要約

リンク予測タスクでは、グラフ内のノードの位置情報を学習することが重要です。
ランドマークと呼ばれる代表ノードを用いた位置情報の表現を提案する。
中心性の高い少数のノードがランドマークとして選択され、ノードの位置の参照点として機能します。
我々は、よく知られているランダム グラフ モデルに対してこの選択戦略を正当化し、ランドマークを含む平均パス長の閉形式境界を導出します。
べき乗則グラフのモデルでは、ランドマークがノード間距離に関する漸近的に正確な情報を提供することを証明します。
私たちは理論的な洞察を実際のネットワークに適用し、ランドマークとクラスタリング (HPLC) による階層位置埋め込みを提案します。
HPLC は、ランドマーク選択とグラフ クラスタリングを組み合わせます。グラフは、最も高い次数を持つノードがランドマークとして選択される密に接続されたクラスターに分割されます。
HPLC は、ランドマークまでのノードの距離、ランドマーク間の距離、クラスターの階層グループ化など、さまざまな階層レベルのランドマークに基づくノードの位置情報を活用します。
実験では、HPLC が HIT@K、MRR、AUC に関してさまざまなデータセットで最先端のリンク予測パフォーマンスを達成することが示されています。
コードは \url{https://github.com/kmswin1/HPLC} で入手できます。

要約(オリジナル)

Learning positional information of nodes in a graph is important for link prediction tasks. We propose a representation of positional information using representative nodes called landmarks. A small number of nodes with high degree centrality are selected as landmarks, which serve as reference points for the nodes’ positions. We justify this selection strategy for well-known random graph models and derive closed-form bounds on the average path lengths involving landmarks. In a model for power-law graphs, we prove that landmarks provide asymptotically exact information on inter-node distances. We apply theoretical insights to practical networks and propose Hierarchical Position embedding with Landmarks and Clustering (HPLC). HPLC combines landmark selection and graph clustering, where the graph is partitioned into densely connected clusters in which nodes with the highest degree are selected as landmarks. HPLC leverages the positional information of nodes based on landmarks at various levels of hierarchy such as nodes’ distances to landmarks, inter-landmark distances and hierarchical grouping of clusters. Experiments show that HPLC achieves state-of-the-art performances of link prediction on various datasets in terms of HIT@K, MRR, and AUC. The code is available at \url{https://github.com/kmswin1/HPLC}.

arxiv情報

著者 Minsang Kim,Seungjun Baek
発行日 2024-04-19 10:23:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク