Context Awareness Gate For Retrieval Augmented Generation


検索拡張生成 (RAG) は、ドメイン固有の質問に答える際に大規模言語モデル (LLM) の制限を軽減するために広く採用されているアプローチとして登場しました。
これまでの研究では、生成パイプラインの全体的なパフォーマンスを向上させるために、取得したデータ チャンクの精度と品質を向上させることに主に焦点が当てられてきました。
この研究では、オープンドメインの質問応答で無関係な情報を取得することの影響を調査し、LLM 出力の品質に対する重大な悪影響を強調します。
この課題に対処するために、ユーザー クエリが外部コンテキストの取得を必要とするかどうかに基づいて LLM の入力プロンプトを動的に調整する新しいメカニズムであるコンテキスト アウェアネス ゲート (CAG) アーキテクチャを提案します。
さらに、統計的で LLM に依存せず、拡張性の高い CAG の中核となる数学的コンポーネントである Vector Candidates メソッドを導入します。
この分析を利用して、検索拡張生成 (RAG) システムのコンテキスト検索プロセスを強化できます。


Retrieval Augmented Generation (RAG) has emerged as a widely adopted approach to mitigate the limitations of large language models (LLMs) in answering domain-specific questions. Previous research has predominantly focused on improving the accuracy and quality of retrieved data chunks to enhance the overall performance of the generation pipeline. However, despite ongoing advancements, the critical issue of retrieving irrelevant information — which can impair the ability of the model to utilize its internal knowledge effectively — has received minimal attention. In this work, we investigate the impact of retrieving irrelevant information in open-domain question answering, highlighting its significant detrimental effect on the quality of LLM outputs. To address this challenge, we propose the Context Awareness Gate (CAG) architecture, a novel mechanism that dynamically adjusts the LLMs’ input prompt based on whether the user query necessitates external context retrieval. Additionally, we introduce the Vector Candidates method, a core mathematical component of CAG that is statistical, LLM-independent, and highly scalable. We further examine the distributions of relationships between contexts and questions, presenting a statistical analysis of these distributions. This analysis can be leveraged to enhance the context retrieval process in Retrieval Augmented Generation (RAG) systems.


著者 Mohammad Hassan Heydari,Arshia Hemmat,Erfan Naman,Afsaneh Fatemi
発行日 2025-01-06 18:23:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.IR, cs.LG パーマリンク