要約
ネットワーク上に広がる影響を最大化するシード セットを見つけることは、よく知られた NP 困難問題です。
貪欲なアルゴリズムは最適に近い解決策を提供できますが、影響推定の部分問題により解決策が非効率になります。
この研究では、独立したカスケードの影響の広がりを推定する方法を学習するグラフ ニューラル ネットワーク \textsc{Glie} を提案します。
GLIE は、教師ありトレーニングを通じて強化された理論上の上限に依存しています。実験によれば、GLIE はトレーニング セットよりも最大 10 倍大きい実際のグラフに対して正確な影響推定を提供します。その後、GLIE を 3 つの影響最大化手法に組み込みます。最初にコストを利用します。
モンテカルロ シミュレーションを GLIE に置き換える効果的な Lazy Forward 最適化により、計算オーバーヘッドはありますがベンチマークを上回ります。
計算効率を向上させるために、私たちはまず、GLIE の予測を使用してシードを順番に選択することを学習する Q 学習方法を考案しました。
最後に、適応的にシード セットを構築しながらノードをランク付けするために、GLIE の表現に基づいて証明できるサブモジュラー影響スプレッドを開発することで、最も効率的なアプローチに到達します。
提案されたアルゴリズムは帰納的です。つまり、300 未満のノードと最大 5 つのシードを含むグラフでトレーニングされ、数百万のノードと最大 200 のシードを含むグラフでテストされます。
最終的な方法は、時間効率と影響の質の最も有望な組み合わせを示し、いくつかのベースラインを上回ります。
要約(オリジナル)
Finding the seed set that maximizes the influence spread over a network is a well-known NP-hard problem. Though a greedy algorithm can provide near-optimal solutions, the subproblem of influence estimation renders the solutions inefficient. In this work, we propose \textsc{Glie}, a graph neural network that learns how to estimate the influence spread of the independent cascade. GLIE relies on a theoretical upper bound that is tightened through supervised training.Experiments indicate that it provides accurate influence estimation for real graphs up to 10 times larger than the train set.Subsequently, we incorporate it into three influence maximization techniques.We first utilize Cost Effective Lazy Forward optimization substituting Monte Carlo simulations with GLIE, surpassing the benchmarks albeit with a computational overhead. To improve computational efficiency we first devise a Q-learning method that learns to choose seeds sequentially using GLIE’s predictions. Finally, we arrive at the most efficient approach by developing a provably submodular influence spread based on GLIE’s representations, to rank nodes while building the seed set adaptively. The proposed algorithms are inductive, meaning they are trained on graphs with less than 300 nodes and up to 5 seeds, and tested on graphs with millions of nodes and up to 200 seeds. The final method exhibits the most promising combination of time efficiency and influence quality, outperforming several baselines.
arxiv情報
著者 | George Panagopoulos,Nikolaos Tziortziotis,Fragkiskos D. Malliaros,Michalis Vazirgiannis |
発行日 | 2023-10-10 12:54:03+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google