要約
検索拡張生成システムは、効果的な文書検索機能に依存しています。
設計上、従来のスパースまたはデンス リトリーバーは、マルチホップ検索シナリオで課題に直面します。
このペーパーでは、2 つの主要な革新によって RAG パフォーマンスを向上させる GeAR について紹介します。(i) BM25 などの従来のベース レトリーバーを強化するグラフ拡張、および (ii) グラフ拡張を組み込んだエージェント フレームワーク。
私たちの評価では、3 つのマルチホップ質問応答データセットに対する GeAR の優れた検索パフォーマンスが実証されました。
さらに、当社のシステムは、他のマルチステップ検索システムと比較して必要なトークンと反復回数が少なく、困難な MuSiQue データセットで 10% を超える改善という最先端の結果を達成します。
要約(オリジナル)
Retrieval-augmented generation systems rely on effective document retrieval capabilities. By design, conventional sparse or dense retrievers face challenges in multi-hop retrieval scenarios. In this paper, we present GeAR, which advances RAG performance through two key innovations: (i) graph expansion, which enhances any conventional base retriever, such as BM25, and (ii) an agent framework that incorporates graph expansion. Our evaluation demonstrates GeAR’s superior retrieval performance on three multi-hop question answering datasets. Additionally, our system achieves state-of-the-art results with improvements exceeding 10% on the challenging MuSiQue dataset, while requiring fewer tokens and iterations compared to other multi-step retrieval systems.
arxiv情報
著者 | Zhili Shen,Chenxin Diao,Pavlos Vougiouklis,Pascual Merita,Shriram Piramanayagam,Damien Graux,Dandan Tu,Zeren Jiang,Ruofei Lai,Yang Ren,Jeff Z. Pan |
発行日 | 2024-12-24 13:45:22+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google