GraphMaster: Automated Graph Synthesis via LLM Agents in Data-Limited Environments

要約

基礎モデルの時代はAIの研究に革命をもたらしましたが、グラフ基礎モデル(GFM)は大規模なグラフコーパスの希少性によって制約されたままです。
従来のグラフデータ統合技術は、主に単純な構造操作に焦点を当てており、意味のあるテキスト属性を持つセマンティックにリッチなノードを生成する能力を欠いています:実際のアプリケーションの重要な制限。
大規模な言語モデル(LLMS)は例外的なテキスト生成機能を示していますが、グラフ合成への直接的な適用は、コンテキストウィンドウの制限、幻覚現象、および構造的一貫性の課題によって妨げられます。
これらの問題に対処するために、データ制限環境でグラフデータ合成用に特別に設計された最初のマルチエージェントフレームワークであるGraphMasterを紹介します。
GraphMasterは、反復的な改良を通じて合成プロセスを共同で最適化する4つの専門LLMエージェント(マネージャー、認識、強化、および評価)を調整し、意味的な一貫性と構造的完全性の両方を確保します。
アプローチを厳密に評価するために、6つの標準グラフベンチマークの新しいデータ制限「サブ」バリアントを作成します。これは、現実的な制約の下で合成機能をテストするために特別に設計されています。
さらに、人間の評価と原則的な牧草地マニホールドベースの分析を組み合わせた新しい解釈可能性評価フレームワークを開発し、セマンティックコヒーレンスの定性的および定量的尺度の両方を提供します。
実験結果は、Graphmasterが複数のデータセットで従来の合成方法を大幅に上回り、データスカース環境でGFMを進めるための強力な基盤を確立することを示しています。

要約(オリジナル)

The era of foundation models has revolutionized AI research, yet Graph Foundation Models (GFMs) remain constrained by the scarcity of large-scale graph corpora. Traditional graph data synthesis techniques primarily focus on simplistic structural operations, lacking the capacity to generate semantically rich nodes with meaningful textual attributes: a critical limitation for real-world applications. While large language models (LLMs) demonstrate exceptional text generation capabilities, their direct application to graph synthesis is impeded by context window limitations, hallucination phenomena, and structural consistency challenges. To address these issues, we introduce GraphMaster, the first multi-agent framework specifically designed for graph data synthesis in data-limited environments. GraphMaster orchestrates four specialized LLM agents (Manager, Perception, Enhancement, and Evaluation) that collaboratively optimize the synthesis process through iterative refinement, ensuring both semantic coherence and structural integrity. To rigorously evaluate our approach, we create new data-limited ‘Sub’ variants of six standard graph benchmarks, specifically designed to test synthesis capabilities under realistic constraints. Additionally, we develop a novel interpretability assessment framework that combines human evaluation with a principled Grassmannian manifold-based analysis, providing both qualitative and quantitative measures of semantic coherence. Experimental results demonstrate that GraphMaster significantly outperforms traditional synthesis methods across multiple datasets, establishing a strong foundation for advancing GFMs in data-scarce environments.

arxiv情報

著者 Enjun Du,Xunkai Li,Tian Jin,Zhihan Zhang,Rong-Hua Li,Guoren Wang
発行日 2025-05-05 13:57:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク