The maximum capability of a topological feature in link prediction

要約

ネットワークは、基礎となるペアごとの相互作用のセットを表すことにより、複雑なシステムをモデル化するための強力なアプローチを提供します。
リンク予測は、直接目に見えないネットワークのリンクを予測するタスクであり、生物学、社会、その他の複雑なシステムに深く応用されています。
このタスクではトポロジー機能が集中的に利用されていますが、ミッシング リンクを推測するためにその機能をどの程度利用できるかは不明です。
ここでは、予測パフォーマンスの上限を特定することで、リンク予測におけるトポロジ特徴の機能を明らかにすることを目的としています。
特徴を評価するためのさまざまな指標、特徴を利用するためのさまざまな予測アプローチ、予測パフォーマンスを定量化するためのさまざまな指標と互換性のある理論的フレームワークを紹介します。
トポロジ フィーチャの最大能力は、シンプルだが理論的に検証された式に従います。この式は、欠落リンクや存在しないリンクにフィーチャがどの程度保持されるかによってのみ決まります。
同じ特徴に基づくインデックスのファミリーは同じ上限を共有するため、他のすべてのインデックスの可能性は 1 つのインデックスから推定できます。
さらに、教師あり予測では機能の能力が向上し、数学的に定量化できるため、機械学習アルゴリズムを適用するメリットを推定できるようになります。
明らかになったパターンの普遍性は、構造的に多様な 550 のネットワークによって経験的に検証されています。
この発見は、機能と方法の選択に応用でき、リンク予測においてトポロジ機能を効果的にするネットワーク特性に光を当てます。

要約(オリジナル)

Networks offer a powerful approach to modeling complex systems by representing the underlying set of pairwise interactions. Link prediction is the task that predicts links of a network that are not directly visible, with profound applications in biological, social, and other complex systems. Despite intensive utilization of the topological feature in this task, it is unclear to what extent a feature can be leveraged to infer missing links. Here, we aim to unveil the capability of a topological feature in link prediction by identifying its prediction performance upper bound. We introduce a theoretical framework that is compatible with different indexes to gauge the feature, different prediction approaches to utilize the feature, and different metrics to quantify the prediction performance. The maximum capability of a topological feature follows a simple yet theoretically validated expression, which only depends on the extent to which the feature is held in missing and nonexistent links. Because a family of indexes based on the same feature shares the same upper bound, the potential of all others can be estimated from one single index. Furthermore, a feature’s capability is lifted in the supervised prediction, which can be mathematically quantified, allowing us to estimate the benefit of applying machine learning algorithms. The universality of the pattern uncovered is empirically verified by 550 structurally diverse networks. The findings have applications in feature and method selection, and shed light on network characteristics that make a topological feature effective in link prediction.

arxiv情報

著者 Yijun Ran,Xiao-Ke Xu,Tao Jia
発行日 2024-04-19 15:40:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.SI, physics.soc-ph パーマリンク