PHLP: Sole Persistent Homology for Link Prediction — Interpretable Feature Extraction

要約

ノード間の接続性を推測するリンク予測 (LP) は、グラフ データの重要な研究分野であり、リンクはノード間の関係に関する重要な情報を表します。
グラフ ニューラル ネットワーク (GNN) ベースのモデルは LP で高いパフォーマンスを達成していますが、そのほとんどが複雑なニューラル ネットワークで構成されているため、そのパフォーマンスが優れている理由を理解するのは困難です。
その高性能の理由を、グラフの位相情報の解析に役立つ位相データ解析手法「永続的ホモロジー(PH)」を採用しています。
我々は、ターゲットリンクの有無がトポロジ全体にどのような影響を与えるかに焦点を当て、PH for LP (PHLP) を採用した新しい手法を提案します。
PHLP は、角度ホップ サブグラフと度倍半径ノード ラベリング (Degree DRNL) と呼ばれる新しいノード ラベリングを利用し、DRNL よりもグラフの情報を区別します。
分類器のみを使用することで、PHLP はほとんどのベンチマーク データセットで最先端 (SOTA) モデルと同様のパフォーマンスを発揮します。
PHLP を使用して計算された出力を既存の GNN ベースの SOTA モデルに組み込むと、すべてのベンチマーク データセットのパフォーマンスが向上します。
私たちの知る限り、PHLP は、GNN を使用せずに PH を LP に適用する最初の方法です。
提案されたアプローチは、ニューラル ネットワークに依存せずに PH を採用することで、パフォーマンスを向上させるための重要な要素を特定することを可能にします。

要約(オリジナル)

Link prediction (LP), inferring the connectivity between nodes, is a significant research area in graph data, where a link represents essential information on relationships between nodes. Although graph neural network (GNN)-based models have achieved high performance in LP, understanding why they perform well is challenging because most comprise complex neural networks. We employ persistent homology (PH), a topological data analysis method that helps analyze the topological information of graphs, to explain the reasons for the high performance. We propose a novel method that employs PH for LP (PHLP) focusing on how the presence or absence of target links influences the overall topology. The PHLP utilizes the angle hop subgraph and new node labeling called degree double radius node labeling (Degree DRNL), distinguishing the information of graphs better than DRNL. Using only a classifier, PHLP performs similarly to state-of-the-art (SOTA) models on most benchmark datasets. Incorporating the outputs calculated using PHLP into the existing GNN-based SOTA models improves performance across all benchmark datasets. To the best of our knowledge, PHLP is the first method of applying PH to LP without GNNs. The proposed approach, employing PH while not relying on neural networks, enables the identification of crucial factors for improving performance.

arxiv情報

著者 Junwon You,Eunwoo Heo,Jae-Hun Jung
発行日 2024-04-23 16:54:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CG, cs.LG, math.AT, stat.ML パーマリンク