A Survey on Knowledge-Oriented Retrieval-Augmented Generation

要約

検索された生成(RAG)は、大規模な回収システムと生成モデルを組み合わせることにより、自然言語の理解と生成を強化する可能性について、近年大きな注目を集めています。
RAGは、ドキュメント、データベース、構造化されたデータなどの外部の知識ソースを活用して、モデルのパフォーマンスを改善し、より正確でコンテキストに関連する出力を生成します。
この調査の目的は、検索メカニズム、生成プロセス、2つの間の統合などの基本的なコンポーネントを調べることにより、RAGの包括的な概要を提供することを目的としています。
動的な外部知識を持つ生成モデルを増強する能力や、検索された情報を生成目標に合わせることに関連する課題など、RAG​​の重要な特性について説明します。
また、基本的な検索された高級アプローチから、マルチモーダルデータと推論機能を組み込んだより高度なモデルに至るまで、RAGメソッドを分類する分類法を提示します。
さらに、RAGシステムの評価に一般的に使用される評価ベンチマークとデータセット、および質問応答、要約、情報の検索などのフィールドでのアプリケーションの詳細な調査をレビューします。
最後に、検索効率の強化、モデルの解釈可能性、ドメイン固有の適応など、RAG​​システムを改善するための新たな研究の方向性と機会を強調します。
この論文は、現実世界の課題に対処する際のRAGの見通しと、自然言語処理のさらなる進歩を促進する可能性を概説することで締めくくります。

要約(オリジナル)

Retrieval-Augmented Generation (RAG) has gained significant attention in recent years for its potential to enhance natural language understanding and generation by combining large-scale retrieval systems with generative models. RAG leverages external knowledge sources, such as documents, databases, or structured data, to improve model performance and generate more accurate and contextually relevant outputs. This survey aims to provide a comprehensive overview of RAG by examining its fundamental components, including retrieval mechanisms, generation processes, and the integration between the two. We discuss the key characteristics of RAG, such as its ability to augment generative models with dynamic external knowledge, and the challenges associated with aligning retrieved information with generative objectives. We also present a taxonomy that categorizes RAG methods, ranging from basic retrieval-augmented approaches to more advanced models incorporating multi-modal data and reasoning capabilities. Additionally, we review the evaluation benchmarks and datasets commonly used to assess RAG systems, along with a detailed exploration of its applications in fields such as question answering, summarization, and information retrieval. Finally, we highlight emerging research directions and opportunities for improving RAG systems, such as enhanced retrieval efficiency, model interpretability, and domain-specific adaptations. This paper concludes by outlining the prospects for RAG in addressing real-world challenges and its potential to drive further advancements in natural language processing.

arxiv情報

著者 Mingyue Cheng,Yucong Luo,Jie Ouyang,Qi Liu,Huijie Liu,Li Li,Shuo Yu,Bohou Zhang,Jiawei Cao,Jie Ma,Daoyu Wang,Enhong Chen
発行日 2025-03-17 11:24:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク