Graph Retrieval-Augmented Generation: A Survey

要約

最近、検索拡張生成 (RAG) は、再トレーニングを必要とせずに大規模言語モデル (LLM) の課題に対処するという点で目覚ましい成功を収めています。
RAG は、外部ナレッジ ベースを参照することで LLM 出力を改良し、「幻覚」、ドメイン固有の知識の欠如、古い情報などの問題を効果的に軽減します。
ただし、データベース内のさまざまなエンティティ間の関係の複雑な構造は、RAG システムにとって課題となります。
これに応じて、GraphRAG はエンティティ全体の構造情報を活用して、より正確かつ包括的な検索を可能にし、関係知識を取得し、より正確でコンテキストを意識した応答を促進します。
GraphRAG の新規性と可能性を考慮すると、現在のテクノロジーを体系的にレビューすることが不可欠です。
このペーパーでは、GraphRAG 方法論の最初の包括的な概要を提供します。
グラフベースのインデックス作成、グラフガイド付き検索、グラフ拡張生成を含む GraphRAG ワークフローを形式化します。
次に、各段階のコア技術とトレーニング方法の概要を説明します。
さらに、下流のタスク、アプリケーション ドメイン、評価方法論、GraphRAG の産業上の使用例も調査します。
最後に、さらなる研究を促し、この分野の進歩を促進するために、将来の研究の方向性を探ります。
この分野の最近の進歩を追跡するために、\url{https://github.com/pengboci/GraphRAG-Survey} にリポジトリをセットアップしました。

要約(オリジナル)

Recently, Retrieval-Augmented Generation (RAG) has achieved remarkable success in addressing the challenges of Large Language Models (LLMs) without necessitating retraining. By referencing an external knowledge base, RAG refines LLM outputs, effectively mitigating issues such as “hallucination”, lack of domain-specific knowledge, and outdated information. However, the complex structure of relationships among different entities in databases presents challenges for RAG systems. In response, GraphRAG leverages structural information across entities to enable more precise and comprehensive retrieval, capturing relational knowledge and facilitating more accurate, context-aware responses. Given the novelty and potential of GraphRAG, a systematic review of current technologies is imperative. This paper provides the first comprehensive overview of GraphRAG methodologies. We formalize the GraphRAG workflow, encompassing Graph-Based Indexing, Graph-Guided Retrieval, and Graph-Enhanced Generation. We then outline the core technologies and training methods at each stage. Additionally, we examine downstream tasks, application domains, evaluation methodologies, and industrial use cases of GraphRAG. Finally, we explore future research directions to inspire further inquiries and advance progress in the field. In order to track recent progress in this field, we set up a repository at \url{https://github.com/pengboci/GraphRAG-Survey}.

arxiv情報

著者 Boci Peng,Yun Zhu,Yongchao Liu,Xiaohe Bo,Haizhou Shi,Chuntao Hong,Yan Zhang,Siliang Tang
発行日 2024-09-10 15:38:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.IR パーマリンク