Retrieval-Augmented Generation with Graphs (GraphRAG)

要約

取得拡張生成 (RAG) は、知識、スキル、ツールなどの追加情報を外部ソースから取得することで、下流のタスクの実行を強化する強力な手法です。
Graph は、その固有の「エッジで接続されたノード」という性質により、大規模な異種情報とリレーショナル情報をエンコードし、膨大な現実世界のアプリケーションにおける RAG の黄金のリソースとなっています。
その結果、最近では RAG に Graph を搭載すること、つまり GraphRAG に対する注目が高まっています。
ただし、取得者、ジェネレーター、および外部データ ソースをニューラル埋め込み空間で均一に設計できる従来の RAG とは異なり、多様なフォーマットおよびドメイン固有のリレーショナル知識などのグラフ構造データの一意性により、独自の課題が生じます。
さまざまなドメイン向けに GraphRAG を設計する際の重要な課題。
幅広い適用性、関連する設計上の課題、GraphRAG の最近の急増を考慮すると、その主要な概念と技術に関する体系的かつ最新の調査が緊急に望まれています。
この動機に従って、GraphRAG に関する包括的かつ最新の調査を紹介します。
私たちの調査では、まず、クエリ プロセッサ、取得者、オーガナイザー、ジェネレーター、データ ソースなどの主要コンポーネントを定義することにより、総合的な GraphRAG フレームワークを提案します。
さらに、異なるドメインのグラフは異なる関係パターンを示し、専用の設計が必要であることを認識して、各ドメインに固有に調整された GraphRAG 手法をレビューします。
最後に、研究の課題について話し合い、分野を超えた機会を生み出すための方向性をブレインストーミングします。
私たちの調査リポジトリは、https://github.com/Graph-RAG/GraphRAG/ で公開管理されています。

要約(オリジナル)

Retrieval-augmented generation (RAG) is a powerful technique that enhances downstream task execution by retrieving additional information, such as knowledge, skills, and tools from external sources. Graph, by its intrinsic ‘nodes connected by edges’ nature, encodes massive heterogeneous and relational information, making it a golden resource for RAG in tremendous real-world applications. As a result, we have recently witnessed increasing attention on equipping RAG with Graph, i.e., GraphRAG. However, unlike conventional RAG, where the retriever, generator, and external data sources can be uniformly designed in the neural-embedding space, the uniqueness of graph-structured data, such as diverse-formatted and domain-specific relational knowledge, poses unique and significant challenges when designing GraphRAG for different domains. Given the broad applicability, the associated design challenges, and the recent surge in GraphRAG, a systematic and up-to-date survey of its key concepts and techniques is urgently desired. Following this motivation, we present a comprehensive and up-to-date survey on GraphRAG. Our survey first proposes a holistic GraphRAG framework by defining its key components, including query processor, retriever, organizer, generator, and data source. Furthermore, recognizing that graphs in different domains exhibit distinct relational patterns and require dedicated designs, we review GraphRAG techniques uniquely tailored to each domain. Finally, we discuss research challenges and brainstorm directions to inspire cross-disciplinary opportunities. Our survey repository is publicly maintained at https://github.com/Graph-RAG/GraphRAG/.

arxiv情報

著者 Haoyu Han,Yu Wang,Harry Shomer,Kai Guo,Jiayuan Ding,Yongjia Lei,Mahantesh Halappanavar,Ryan A. Rossi,Subhabrata Mukherjee,Xianfeng Tang,Qi He,Zhigang Hua,Bo Long,Tong Zhao,Neil Shah,Amin Javari,Yinglong Xia,Jiliang Tang
発行日 2025-01-08 05:16:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.IR, cs.LG パーマリンク