Retrieval-Augmented Generation for AI-Generated Content: A Survey

要約

モデル アルゴリズムの進歩、基礎モデルの成長、高品質のデータセットへのアクセスにより、人工知能生成コンテンツ (AIGC) の進化が推進されています。
AIGC は目覚ましい成功を収めているにもかかわらず、知識の更新、ロングテール データの処理、データ漏洩の軽減、トレーニングと推論の高額なコストの管理などのハードルに依然として直面しています。
検索拡張生成 (RAG) は、このような課題に対処するパラダイムとして最近登場しました。
特に、RAG は情報取得プロセスを導入しており、利用可能なデータ ストアから関連オブジェクトを取得することで生成プロセスを強化し、精度と堅牢性の向上につながります。
このペーパーでは、RAG 技術を AIGC シナリオに統合する既存の取り組みを包括的にレビューします。
まず、レトリーバーがジェネレーターを拡張する方法に従って RAG 基盤を分類し、さまざまなレトリーバーとジェネレーターの拡張方法論の基本的な抽象化を抽出します。
この統一された視点は、すべての RAG シナリオを網羅し、潜在的な将来の進歩に役立つ進歩と極めて重要なテクノロジーを明らかにします。
また、RAG システムの効果的なエンジニアリングと実装を促進する、RAG の追加の拡張方法についてもまとめます。
次に、別の観点から、さまざまなモダリティやタスクにわたる RAG の実際の応用について調査し、研究者や実践者に貴重な参考資料を提供します。
さらに、RAG のベンチマークを紹介し、現在の RAG システムの限界について説明し、将来の研究の潜在的な方向性を提案します。
Github: https://github.com/PKU-DAIR/RAG-Survey。

要約(オリジナル)

Advancements in model algorithms, the growth of foundational models, and access to high-quality datasets have propelled the evolution of Artificial Intelligence Generated Content (AIGC). Despite its notable successes, AIGC still faces hurdles such as updating knowledge, handling long-tail data, mitigating data leakage, and managing high training and inference costs. Retrieval-Augmented Generation (RAG) has recently emerged as a paradigm to address such challenges. In particular, RAG introduces the information retrieval process, which enhances the generation process by retrieving relevant objects from available data stores, leading to higher accuracy and better robustness. In this paper, we comprehensively review existing efforts that integrate RAG technique into AIGC scenarios. We first classify RAG foundations according to how the retriever augments the generator, distilling the fundamental abstractions of the augmentation methodologies for various retrievers and generators. This unified perspective encompasses all RAG scenarios, illuminating advancements and pivotal technologies that help with potential future progress. We also summarize additional enhancements methods for RAG, facilitating effective engineering and implementation of RAG systems. Then from another view, we survey on practical applications of RAG across different modalities and tasks, offering valuable references for researchers and practitioners. Furthermore, we introduce the benchmarks for RAG, discuss the limitations of current RAG systems, and suggest potential directions for future research. Github: https://github.com/PKU-DAIR/RAG-Survey.

arxiv情報

著者 Penghao Zhao,Hailin Zhang,Qinhan Yu,Zhengren Wang,Yunteng Geng,Fangcheng Fu,Ling Yang,Wentao Zhang,Jie Jiang,Bin Cui
発行日 2024-05-02 16:25:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク