要約
ネットワーク サイエンスと機械学習の間のインターフェイスに位置するノード埋め込みアルゴリズムは、グラフを入力として受け取り、その構造を抽象的な幾何学的空間内のノードを表す出力ベクトルにエンコードして、ネットワーク モデリング、データ圧縮、
リンク予測とコミュニティ検出。
一見無関係な 2 つの制限がこれらのアルゴリズムに影響を与えます。
一方で、ベクトル空間を定義する基本的な演算、つまりベクトル和がネットワーク内の元のノードの観点から何に対応するのかは明らかではありません。
一方、構成ノードを任意のブロックノードに粗粒化することで、同じ入力ネットワークを複数の解像度レベルで表現できますが、異なる階層レベルで得られたノード埋め込み間の関係は理解されていません。
ここでは、ネットワーク繰り込み理論の最近の結果に基づいて、これら 2 つの制限に同時に対処し、任意の粗視化に基づいて、ブロック ノードの埋め込みベクトルとブロック ノードの埋め込みベクトルの統計的一貫性を保証するマルチスケール ノード埋め込み手法を定義します。
その構成ノードの埋め込みベクトル。
我々は、複数の解像度レベルで自然に表現できる 2 つの経済ネットワーク、すなわち、国家 (セット) 間の国際貿易とオランダの産業 (セット) 間の投入産出フローにおけるこのアプローチの力を説明します。
粗粒度のノード ベクトルから取得したネットワークと、細粒度のノード ベクトルの合計から取得したネットワーク間の統計的一貫性を確認します。これは、代替手法では達成できない結果です。
多数の三角形を含むいくつかの主要なネットワーク プロパティは、非常に低次元の埋め込みからすでに正常に複製されており、任意の解像度レベルで元のネットワークの忠実なレプリカを生成できます。
要約(オリジナル)
Lying at the interface between Network Science and Machine Learning, node embedding algorithms take a graph as input and encode its structure onto output vectors that represent nodes in an abstract geometric space, enabling various vector-based downstream tasks such as network modelling, data compression, link prediction, and community detection. Two apparently unrelated limitations affect these algorithms. On one hand, it is not clear what the basic operation defining vector spaces, i.e. the vector sum, corresponds to in terms of the original nodes in the network. On the other hand, while the same input network can be represented at multiple levels of resolution by coarse-graining the constituent nodes into arbitrary block-nodes, the relationship between node embeddings obtained at different hierarchical levels is not understood. Here, building on recent results in network renormalization theory, we address these two limitations at once and define a multiscale node embedding method that, upon arbitrary coarse-grainings, ensures statistical consistency of the embedding vector of a block-node with the sum of the embedding vectors of its constituent nodes. We illustrate the power of this approach on two economic networks that can be naturally represented at multiple resolution levels: namely, the international trade between (sets of) countries and the input-output flows among (sets of) industries in the Netherlands. We confirm the statistical consistency between networks retrieved from coarse-grained node vectors and networks retrieved from sums of fine-grained node vectors, a result that cannot be achieved by alternative methods. Several key network properties, including a large number of triangles, are successfully replicated already from embeddings of very low dimensionality, allowing for the generation of faithful replicas of the original networks at arbitrary resolution levels.
arxiv情報
著者 | Riccardo Milocco,Fabian Jansen,Diego Garlaschelli |
発行日 | 2024-12-05 17:12:45+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google