PULL: PU-Learning-based Accurate Link Prediction

要約

エッジが不完全なグラフが与えられた場合、失われたリンクを正確に見つけるにはどうすればよいでしょうか?
エッジ不完全グラフにおけるリンク予測は、エンティティ間の関係がグラフとして表されるときに、エンティティ間に欠落している関係を発見することを目的としています。
エッジ不完全グラフは、ソーシャル ネットワークで友達を追加するときにすべてのユーザーをチェックしないなどの実際的な制限により、現実世界に蔓延しています。
この問題に対処することは、ソーシャル ネットワークで友人を推薦したり、引用ネットワークで参考文献を見つけたりするなど、さまざまなタスクにとって重要です。
ただし、これまでのアプローチは、特定のエッジ不完全 (観測された) グラフに大きく依存しており、トレーニング中に欠落している (観測されていない) リンクを考慮することが困難でした。
本稿では、Positive-Unlabeled (PU) 学習に基づく高精度なリンク予測手法である PULL (PU-Learning-based Link detector) を提案します。
PULL は、トレーニング グラフで観察されたエッジを正の例として扱い、接続されていないノード ペアをラベルのないノード ペアとして扱います。
PULL は、すべてのエッジに対して潜在変数を提案し、変数に関して予想されるグラフ構造を活用することにより、リンク予測子が観測されたグラフに過剰適合するのを効果的に防ぎます。
5 つの現実世界のデータセットに対する広範な実験により、PULL は、エッジが不完全なグラフのリンクを予測するベースラインを常に上回っていることが示されています。

要約(オリジナル)

Given an edge-incomplete graph, how can we accurately find the missing links? The link prediction in edge-incomplete graphs aims to discover the missing relations between entities when their relationships are represented as a graph. Edge-incomplete graphs are prevalent in real-world due to practical limitations, such as not checking all users when adding friends in a social network. Addressing the problem is crucial for various tasks, including recommending friends in social networks and finding references in citation networks. However, previous approaches rely heavily on the given edge-incomplete (observed) graph, making it challenging to consider the missing (unobserved) links during training. In this paper, we propose PULL (PU-Learning-based Link predictor), an accurate link prediction method based on the positive-unlabeled (PU) learning. PULL treats the observed edges in the training graph as positive examples, and the unconnected node pairs as unlabeled ones. PULL effectively prevents the link predictor from overfitting to the observed graph by proposing latent variables for every edge, and leveraging the expected graph structure with respect to the variables. Extensive experiments on five real-world datasets show that PULL consistently outperforms the baselines for predicting links in edge-incomplete graphs.

arxiv情報

著者 Junghun Kim,Ka Hyun Park,Hoyoung Yoon,U Kang
発行日 2024-05-20 09:47:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.SI パーマリンク