Enhancing Retrieval and Managing Retrieval: A Four-Module Synergy for Improved Quality and Efficiency in RAG Systems

要約

検索拡張生成 (RAG) 技術は、大規模言語モデル (LLM) のコンテキスト内学習機能を利用して、より正確で関連性の高い応答を生成します。
シンプルな「取得してから読み取る」アプローチから生まれた RAG フレームワークは、柔軟性の高いモジュール式のパラダイムに進化しました。
重要なコンポーネントであるクエリ リライター モジュールは、検索しやすいクエリを生成することでナレッジの検索を強化します。
この方法では、入力された質問が知識ベースとより密接に一致します。
私たちの調査では、単一のクエリに関連する情報プラトーを克服するために複数のクエリを生成し、曖昧さを排除するために質問を書き換えることにより、根底にある意図を明確にすることにより、クエリ リライター モジュールをクエリ リライター + に強化する機会が特定されました。
また、現在の RAG システムには無関係な知識に関する問題があることもわかりました。
これを克服するために、ナレッジ フィルターを提案します。
これら 2 つのモジュールはどちらも命令調整された Gemma-2B モデルに基づいており、これらが連携して応答品質を向上させます。
最後に特定された問題は冗長な取得です。
これを解決するために、Memory Knowledge Reservoir と Retriever Trigger を導入します。
前者はパラメータを使用しない方法で RAG システムの知識ベースの動的な拡張をサポートし、後者は外部知識にアクセスするためのコストを最適化し、それによってリソースの使用率と応答効率を向上させます。
これら 4 つの RAG モジュールは、相乗的に RAG システムの応答品質と効率を向上させます。
これらのモジュールの有効性は、6 つの一般的な QA データセットにわたる実験とアブレーション研究を通じて検証されています。
ソース コードは https://github.com/Ancientshi/ERM4 からアクセスできます。

要約(オリジナル)

Retrieval-augmented generation (RAG) techniques leverage the in-context learning capabilities of large language models (LLMs) to produce more accurate and relevant responses. Originating from the simple ‘retrieve-then-read’ approach, the RAG framework has evolved into a highly flexible and modular paradigm. A critical component, the Query Rewriter module, enhances knowledge retrieval by generating a search-friendly query. This method aligns input questions more closely with the knowledge base. Our research identifies opportunities to enhance the Query Rewriter module to Query Rewriter+ by generating multiple queries to overcome the Information Plateaus associated with a single query and by rewriting questions to eliminate Ambiguity, thereby clarifying the underlying intent. We also find that current RAG systems exhibit issues with Irrelevant Knowledge; to overcome this, we propose the Knowledge Filter. These two modules are both based on the instruction-tuned Gemma-2B model, which together enhance response quality. The final identified issue is Redundant Retrieval; we introduce the Memory Knowledge Reservoir and the Retriever Trigger to solve this. The former supports the dynamic expansion of the RAG system’s knowledge base in a parameter-free manner, while the latter optimizes the cost for accessing external knowledge, thereby improving resource utilization and response efficiency. These four RAG modules synergistically improve the response quality and efficiency of the RAG system. The effectiveness of these modules has been validated through experiments and ablation studies across six common QA datasets. The source code can be accessed at https://github.com/Ancientshi/ERM4.

arxiv情報

著者 Yunxiao Shi,Xing Zi,Zijing Shi,Haimin Zhang,Qiang Wu,Min Xu
発行日 2024-07-15 12:35:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク