要約
グラフ生成は、社会、技術、科学分析において広く研究されてきた基本的なタスクです。
動的なグラフの進化プロセスをモデル化する場合、従来のルールベースの手法ではグラフ内のコミュニティ構造を捉えるのが困難ですが、深層学習手法ではトレーニング グラフのフィッティングのみに焦点を当てています。
これにより、既存のグラフ ジェネレーターは、事前定義されたルールに従うグラフ、またはトレーニング データセットによく似たグラフの生成に制限され、動的グラフ生成のパフォーマンスが低下します。
グラフが人間の活動におけるペアごとの相互作用から生じる抽象的な表現であることを考えると、人間による相互作用の現実的なシミュレーションは、グラフの進化メカニズムに対するより深い洞察を提供する可能性があります。
人間の行動をシミュレーションする際の大規模言語モデル (LLM) の認識が高まっているため、動的グラフ生成のための新しいシミュレーション ベースのフレームワークである GraphAgent-Generator (GAG) を紹介します。
LLM のトレーニングや微調整プロセスを行わずに、私たちのフレームワークは確立されたネットワーク科学理論の 7 つのマクロレベルの構造特性を効果的に再現し、グラフ拡張タスクの既存のベースラインを特定の評価メトリクスで 31\% 上回ります。
ノード分類タスクを通じて、生成されたテキストリッチなグラフ内のノードごとのテキスト特徴について、GAG が現実世界のネットワークの特性を効果的に保存していることを検証します。
さらに、並列アクセラレーションを組み込むことにより、GAG は、大規模な LLM ベースのエージェント シミュレーションを通じて、最大 100,000 近くのノードまたは 1,000 万のエッジを含むグラフの生成をサポートし、最小 90.4\% の速度向上を実現します。
ソース コードは https://anonymous.4open.science/r/GraphAgent-2206 で入手できます。
要約(オリジナル)
Graph generation is a fundamental task that has been extensively studied in social, technological, and scientific analysis. For modeling the dynamic graph evolution process, traditional rule-based methods struggle to capture community structures within graphs, while deep learning methods only focus on fitting training graphs. This limits existing graph generators to producing graphs that adhere to predefined rules or closely resemble training datasets, achieving poor performance in dynamic graph generation. Given that graphs are abstract representations arising from pairwise interactions in human activities, a realistic simulation of human-wise interaction could provide deeper insights into the graph evolution mechanism. With the increasing recognition of large language models (LLMs) in simulating human behavior, we introduce GraphAgent-Generator (GAG), a novel simulation-based framework for dynamic graph generation. Without training or fine-tuning process of LLM, our framework effectively replicates seven macro-level structural characteristics in established network science theories while surpassing existing baselines in graph expansion tasks by 31\% on specific evaluation metrics. Through node classification task, we validate GAG effectively preserves characteristics of real-world network for node-wise textual features in generated text-rich graph. Furthermore, by incorporating parallel acceleration, GAG supports generating graphs with up to nearly 100,000 nodes or 10 million edges through large-scale LLM-based agent simulation, with a minimum speed-up of 90.4\%. The source code is available at https://anonymous.4open.science/r/GraphAgent-2206.
arxiv情報
著者 | Jiarui Ji,Runlin Lei,Jialing Bi,Zhewei Wei,Yankai Lin,Xuchen Pan,Yaliang Li,Bolin Ding |
発行日 | 2024-11-11 14:41:53+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google