要約
AIGC (Artificial Intelligence Generated Content) の開発は、モデル アルゴリズムの進歩、スケーラブルな基盤モデル アーキテクチャ、および豊富な高品質データセットの利用可能性によって促進されています。
AIGC は目覚ましいパフォーマンスを達成しましたが、最新のロングテール知識を維持することの難しさ、データ漏洩のリスク、トレーニングと推論に関連する高額なコストなどの課題に依然として直面しています。
検索拡張生成 (RAG) は、このような課題に対処するパラダイムとして最近登場しました。
特に、RAG は情報取得プロセスを導入しており、利用可能なデータ ストアから関連オブジェクトを取得することで AIGC の結果を強化し、精度と堅牢性の向上につながります。
このペーパーでは、RAG 技術を AIGC シナリオに統合する既存の取り組みを包括的にレビューします。
まず、レトリーバーがジェネレーターをどのように増強するかに従って RAG ファンデーションを分類します。
私たちは、さまざまなレトリーバーやジェネレーターのための拡張方法論の基本的な抽象化を抽出します。
この統一された視点は、すべての RAG シナリオを網羅し、潜在的な将来の進歩に役立つ進歩と極めて重要なテクノロジーを明らかにします。
また、RAG システムの効果的なエンジニアリングと実装を促進する、RAG の追加の拡張方法についてもまとめます。
次に、別の観点から、さまざまなモダリティやタスクにわたる RAG の実際の応用について調査し、研究者や実践者に貴重な参考資料を提供します。
さらに、RAG のベンチマークを紹介し、現在の RAG システムの限界について説明し、将来の研究の潜在的な方向性を提案します。
プロジェクト: https://github.com/hymie122/RAG-Survey
要約(オリジナル)
The development of Artificial Intelligence Generated Content (AIGC) has been facilitated by advancements in model algorithms, scalable foundation model architectures, and the availability of ample high-quality datasets. While AIGC has achieved remarkable performance, it still faces challenges, such as the difficulty of maintaining up-to-date and long-tail knowledge, the risk of data leakage, and the high costs associated with training and inference. Retrieval-Augmented Generation (RAG) has recently emerged as a paradigm to address such challenges. In particular, RAG introduces the information retrieval process, which enhances AIGC results by retrieving relevant objects from available data stores, leading to greater accuracy and robustness. In this paper, we comprehensively review existing efforts that integrate RAG technique into AIGC scenarios. We first classify RAG foundations according to how the retriever augments the generator. We distill the fundamental abstractions of the augmentation methodologies for various retrievers and generators. This unified perspective encompasses all RAG scenarios, illuminating advancements and pivotal technologies that help with potential future progress. We also summarize additional enhancements methods for RAG, facilitating effective engineering and implementation of RAG systems. Then from another view, we survey on practical applications of RAG across different modalities and tasks, offering valuable references for researchers and practitioners. Furthermore, we introduce the benchmarks for RAG, discuss the limitations of current RAG systems, and suggest potential directions for future research. Project: https://github.com/hymie122/RAG-Survey
arxiv情報
著者 | Penghao Zhao,Hailin Zhang,Qinhan Yu,Zhengren Wang,Yunteng Geng,Fangcheng Fu,Ling Yang,Wentao Zhang,Bin Cui |
発行日 | 2024-02-29 18:59:01+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google