NetEffect: Discovery and Exploitation of Generalized Network Effects

要約

ノード ラベルがほとんどない大きなグラフを考えると、(a) 一般化ネットワーク効果 (GNE) があるかどうかを識別し、(b) GNE を推定してノード クラス間の相互関係を説明し、(c) GNE を効率的に利用して、
下流タスクのパフォーマンスを向上させるには?
GNE の知識は、ノード分類やターゲットを絞った広告などのさまざまなタスクに役立ちます。
ただし、現実世界のグラフでは、利用可能なノード ラベルとノイズの多いエッジが限られているため、同性愛、異性愛、またはそれらの組み合わせなどの GNE を識別することは困難です。
我々は、上記の問題に対処するためのグラフ マイニング アプローチである NetEffect を提案します。これには、次の特性があります。 (i) 原理: ノード ラベルがほとんどないグラフ内の GNE の存在を判断するための統計的テスト。
(ii) 一般的かつ説明可能: 観察された特定のタイプの GNE を推定するための閉じた形式のソリューション。
(iii) 正確かつスケーラブル: 正確かつ高速なノード分類のための GNE の統合。
NetEffect を現実世界のグラフに適用すると、異種性を示すと認識されていた多数のグラフに GNE が予期せず存在しないことがわかります。
さらに、GNE を組み込むことがノード分類に効果的であることを示します。
100 万スケールの実世界のグラフでは、NetEffect はほとんどの競合他社と比較して 7 倍以上の高速化 (14 分対 2 時間) を達成します。

要約(オリジナル)

Given a large graph with few node labels, how can we (a) identify whether there is generalized network-effects (GNE) or not, (b) estimate GNE to explain the interrelations among node classes, and (c) exploit GNE efficiently to improve the performance on downstream tasks? The knowledge of GNE is valuable for various tasks like node classification, and targeted advertising. However, identifying GNE such as homophily, heterophily or their combination is challenging in real-world graphs due to limited availability of node labels and noisy edges. We propose NetEffect, a graph mining approach to address the above issues, enjoying the following properties: (i) Principled: a statistical test to determine the presence of GNE in a graph with few node labels; (ii) General and Explainable: a closed-form solution to estimate the specific type of GNE observed; and (iii) Accurate and Scalable: the integration of GNE for accurate and fast node classification. Applied on real-world graphs, NetEffect discovers the unexpected absence of GNE in numerous graphs, which were recognized to exhibit heterophily. Further, we show that incorporating GNE is effective on node classification. On a million-scale real-world graph, NetEffect achieves over 7 times speedup (14 minutes vs. 2 hours) compared to most competitors.

arxiv情報

著者 Meng-Chieh Lee,Shubhranshu Shekhar,Jaemin Yoo,Christos Faloutsos
発行日 2024-02-12 16:59:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.SI パーマリンク