要約
検索拡張生成 (RAG) では、検索は常に役立つとは限らず、それをすべての命令に適用することは最適とは言えません。
したがって、RAG にとって取得するかどうかの決定は重要であり、これは通常アクティブ取得と呼ばれます。
しかし、既存のアクティブ検索手法は 2 つの課題に直面しています。 1. 通常、単一の基準に依存するため、さまざまな種類の命令の処理に苦労します。
2. これらは専門的で高度に差別化された手順に依存しているため、これらを組み合わせると RAG システムがより複雑になり、応答遅延が長くなります。
これらの課題に対処するために、私たちは統合アクティブ取得 (UAR) を提案します。
UAR には 4 つの直交基準が含まれており、それらをプラグアンドプレイ分類タスクにキャストします。これにより、無視できる追加の推論コストで多面的な取得タイミングの判断が実現されます。
さらに、標準化された手順を通じて多様なアクティブ検索シナリオを処理するように設計された、統合アクティブ検索基準 (UAR-Criteria) を紹介します。
代表的な 4 種類のユーザー命令に関する実験では、UAR が取得タイミングの判断と下流タスクのパフォーマンスにおいて既存の研究を大幅に上回っていることが示されており、UAR の有効性と下流タスクへの有用性が示されています。
要約(オリジナル)
In Retrieval-Augmented Generation (RAG), retrieval is not always helpful and applying it to every instruction is sub-optimal. Therefore, determining whether to retrieve is crucial for RAG, which is usually referred to as Active Retrieval. However, existing active retrieval methods face two challenges: 1. They usually rely on a single criterion, which struggles with handling various types of instructions. 2. They depend on specialized and highly differentiated procedures, and thus combining them makes the RAG system more complicated and leads to higher response latency. To address these challenges, we propose Unified Active Retrieval (UAR). UAR contains four orthogonal criteria and casts them into plug-and-play classification tasks, which achieves multifaceted retrieval timing judgements with negligible extra inference cost. We further introduce the Unified Active Retrieval Criteria (UAR-Criteria), designed to process diverse active retrieval scenarios through a standardized procedure. Experiments on four representative types of user instructions show that UAR significantly outperforms existing work on the retrieval timing judgement and the performance of downstream tasks, which shows the effectiveness of UAR and its helpfulness to downstream tasks.
arxiv情報
著者 | Qinyuan Cheng,Xiaonan Li,Shimin Li,Qin Zhu,Zhangyue Yin,Yunfan Shao,Linyang Li,Tianxiang Sun,Hang Yan,Xipeng Qiu |
発行日 | 2024-06-27 15:37:15+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google