Enhancing Retrieval-Augmented Generation: A Study of Best Practices

要約

検索拡張生成 (RAG) システムは、最近、検索メカニズムを言語モデルに統合することで目覚ましい進歩を示し、より正確で文脈に関連した応答を生成する能力を強化しています。
ただし、RAG システム内のさまざまなコンポーネントや構成の影響については、まだ十分に調査されていません。
RAG システムを複雑な検索タスクに合わせて調整し、さまざまなアプリケーションにわたって最適なパフォーマンスを確保するには、これらの要素を包括的に理解することが不可欠です。
この論文では、クエリ拡張、さまざまな新しい検索戦略、および新しい Contrastive In-Context Learning RAG を組み込んだいくつかの高度な RAG システム設計を開発します。
私たちの研究では、言語モデルのサイズ、プロンプト設計、ドキュメントチャンクサイズ、ナレッジベースのサイズ、検索ストライド、クエリ拡張テクニック、対照的インコンテキスト学習ナレッジベース、多言語ナレッジベース、文中の関連コンテキストを取得するフォーカスモードなどの重要な要素を系統的に調査しています。
-レベル。
広範な実験を通じて、これらの要因が応答の品質にどのように影響するかを詳細に分析します。
私たちの調査結果は、コンテキストの豊かさと検索生成の効率性のバランスをとりながら RAG システムを開発するための実用的な洞察を提供し、それによって、現実世界の多様なシナリオにおいて、より適応性が高くパフォーマンスの高い RAG フレームワークへの道を切り開きます。
コードと実装の詳細は公開されています。

要約(オリジナル)

Retrieval-Augmented Generation (RAG) systems have recently shown remarkable advancements by integrating retrieval mechanisms into language models, enhancing their ability to produce more accurate and contextually relevant responses. However, the influence of various components and configurations within RAG systems remains underexplored. A comprehensive understanding of these elements is essential for tailoring RAG systems to complex retrieval tasks and ensuring optimal performance across diverse applications. In this paper, we develop several advanced RAG system designs that incorporate query expansion, various novel retrieval strategies, and a novel Contrastive In-Context Learning RAG. Our study systematically investigates key factors, including language model size, prompt design, document chunk size, knowledge base size, retrieval stride, query expansion techniques, Contrastive In-Context Learning knowledge bases, multilingual knowledge bases, and Focus Mode retrieving relevant context at sentence-level. Through extensive experimentation, we provide a detailed analysis of how these factors influence response quality. Our findings offer actionable insights for developing RAG systems, striking a balance between contextual richness and retrieval-generation efficiency, thereby paving the way for more adaptable and high-performing RAG frameworks in diverse real-world scenarios. Our code and implementation details are publicly available.

arxiv情報

著者 Siran Li,Linus Stenzel,Carsten Eickhoff,Seyed Ali Bahrainian
発行日 2025-01-13 15:07:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク