QA-Expand: Multi-Question Answer Generation for Enhanced Query Expansion in Information Retrieval

要約

クエリの拡張は、追加のコンテキスト情報でクエリを充実させることにより、検索結果を改善するために情報検索(IR)で広く使用されています。
最近の大規模な言語モデル(LLM)ベースのメソッドは、擬似関連コンテンツを生成し、複数のプロンプトを介して用語を拡張しますが、多くの場合、関連するすべての情報を取得するために必要な多様なコンテキストを欠く繰り返しの狭い拡張を生成します。
この論文では、クエリ拡張のための斬新で効果的なフレームワークであるQA-Expandを紹介します。
最初に最初のクエリから複数の関連する質問を生成し、その後、サロゲートドキュメントとして対応する擬似回答を生成します。
フィードバックモデルは、これらの回答をさらに書き直してフィルタリングして、最も有益な増強のみが組み込まれていることを確認します。
BeirやTRECなどのベンチマークでの広範な実験は、QA拡張機能が最新の方法よりも最大13%の検索パフォーマンスを強化し、最新の検索課題に堅牢なソリューションを提供することを示しています。

要約(オリジナル)

Query expansion is widely used in Information Retrieval (IR) to improve search outcomes by enriching queries with additional contextual information. Although recent Large Language Model (LLM) based methods generate pseudo-relevant content and expanded terms via multiple prompts, they often yield repetitive, narrow expansions that lack the diverse context needed to retrieve all relevant information. In this paper, we introduce QA-Expand, a novel and effective framework for query expansion. It first generates multiple relevant questions from the initial query and subsequently produces corresponding pseudo-answers as surrogate documents. A feedback model further rewrites and filters these answers to ensure only the most informative augmentations are incorporated. Extensive experiments on benchmarks such as BEIR and TREC demonstrate that QA-Expand enhances retrieval performance by up to 13% over state-of-the-art methods, offering a robust solution for modern retrieval challenges.

arxiv情報

著者 Wonduk Seo,Seunghyun Lee
発行日 2025-02-12 16:39:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.IR, cs.LG, cs.MA パーマリンク