要約
私たちは、オープンドメインの質問応答へのアプリケーションを使用して、パッセージ検索を改善するためのクエリ拡張と再ランキングのアプローチである EAR を提案します。
EAR は、まずクエリ拡張モデルを適用してさまざまなクエリのセットを生成し、次にクエリ リランカーを使用して、より良い検索結果につながる可能性のあるクエリを選択します。
貪欲なデコードでは最良のクエリ拡張が選択されないことが多いという観察に基づいて、EAR は、特定の取得者に拡張クエリを発行するときに、ゴールド パッセージのランク順序を予測するようにリランカーをトレーニングします。
EAR は、クエリ拡張モデルとリトリーバーをより適切に接続することにより、従来のスパース検索メソッドである BM25 を大幅に強化します。
経験的に、EAR は、標準的なクエリ拡張モデル、GAR、および高密度取得モデルと比較した場合、ドメイン内設定およびドメイン外設定で上位 5/20 の精度をそれぞれ 3 ~ 8 ポイントおよび 5 ~ 10 ポイント向上させます。
DPR。
要約(オリジナル)
We propose EAR, a query Expansion And Reranking approach for improving passage retrieval, with the application to open-domain question answering. EAR first applies a query expansion model to generate a diverse set of queries, and then uses a query reranker to select the ones that could lead to better retrieval results. Motivated by the observation that the best query expansion often is not picked by greedy decoding, EAR trains its reranker to predict the rank orders of the gold passages when issuing the expanded queries to a given retriever. By connecting better the query expansion model and retriever, EAR significantly enhances a traditional sparse retrieval method, BM25. Empirically, EAR improves top-5/20 accuracy by 3-8 and 5-10 points in in-domain and out-of-domain settings, respectively, when compared to a vanilla query expansion model, GAR, and a dense retrieval model, DPR.
arxiv情報
著者 | Yung-Sung Chuang,Wei Fang,Shang-Wen Li,Wen-tau Yih,James Glass |
発行日 | 2023-05-26 16:41:03+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google