LEGO-GraphRAG: Modularizing Graph-based Retrieval-Augmented Generation for Design Space Exploration

要約

GraphRAG は、(ナレッジ) グラフを大規模言語モデル (LLM) と統合して、推論の精度と文脈の関連性を向上させます。
GraphRAG には有望なアプリケーションがあり、データベースや自然言語処理などの複数の研究コミュニティとの強い関連性があるにもかかわらず、現在、モジュール式ワークフロー分析、体系的なソリューション フレームワーク、洞察力に富んだ実証研究が不足しています。
これらのギャップを埋めるために、私たちは LEGO-GraphRAG を提案します。これは、1) GraphRAG ワークフローのきめ細かい分解、2) 既存の手法と実装された GraphRAG インスタンスの系統的な分類、3) 新しい GraphRAG インスタンスの作成を可能にするモジュラー フレームワークです。
私たちのフレームワークは、大規模な実世界のグラフと多様なクエリ セットに関する GraphRAG の包括的な実証研究を促進し、高度な GraphRAG システムの構築に不可欠な推論の品質、実行時の効率、トークンまたは GPU コストのバランスに関する洞察を明らかにします。

要約(オリジナル)

GraphRAG integrates (knowledge) graphs with large language models (LLMs) to improve reasoning accuracy and contextual relevance. Despite its promising applications and strong relevance to multiple research communities, such as databases and natural language processing, GraphRAG currently lacks modular workflow analysis, systematic solution frameworks, and insightful empirical studies. To bridge these gaps, we propose LEGO-GraphRAG, a modular framework that enables: 1) fine-grained decomposition of the GraphRAG workflow, 2) systematic classification of existing techniques and implemented GraphRAG instances, and 3) creation of new GraphRAG instances. Our framework facilitates comprehensive empirical studies of GraphRAG on large-scale real-world graphs and diverse query sets, revealing insights into balancing reasoning quality, runtime efficiency, and token or GPU cost, that are essential for building advanced GraphRAG systems.

arxiv情報

著者 Yukun Cao,Zengyi Gao,Zhiyang Li,Xike Xie,Kevin Zhou,Jianliang Xu
発行日 2025-01-17 05:33:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク