Hybrid and Collaborative Passage Reranking

要約

パッセージ検索システムでは、最初のパッセージ検索結果が満足のいくものではない場合がありますが、再ランキング スキームによって改善することができます。
パッセージの再ランキングに対する既存のソリューションは、クエリと各パッセージの間の相互作用を個別に強化することに焦点を当てており、最初の検索リストの上位にランクされたパッセージ間のコンテキストは無視されています。
この問題に取り組むために、我々はハイブリッドおよび協調的パッセージ再ランキング (HybRank) メソッドを提案します。このメソッドは、パッセージのコラボレーションに上流の検索バーの実質的な類似性測定を活用し、再ランキングに疎な検索バーと密な検索バーの語彙的および意味論的な特性を組み込みます。
さらに、HybRank は、既製の検索機能に基づいて構築されており、以前に再ランク付けされたものを含む任意のパッセージ リストを強化できるプラグイン リランカーです。
広範な実験により、一般的な検索および再ランキング方法と比較してパフォーマンスが安定して向上していることが実証され、HybRank のコア コンポーネントの有効性が検証されています。

要約(オリジナル)

In passage retrieval system, the initial passage retrieval results may be unsatisfactory, which can be refined by a reranking scheme. Existing solutions to passage reranking focus on enriching the interaction between query and each passage separately, neglecting the context among the top-ranked passages in the initial retrieval list. To tackle this problem, we propose a Hybrid and Collaborative Passage Reranking (HybRank) method, which leverages the substantial similarity measurements of upstream retrievers for passage collaboration and incorporates the lexical and semantic properties of sparse and dense retrievers for reranking. Besides, built on off-the-shelf retriever features, HybRank is a plug-in reranker capable of enhancing arbitrary passage lists including previously reranked ones. Extensive experiments demonstrate the stable improvements of performance over prevalent retrieval and reranking methods, and verify the effectiveness of the core components of HybRank.

arxiv情報

著者 Zongmeng Zhang,Wengang Zhou,Jiaxin Shi,Houqiang Li
発行日 2023-05-16 09:38:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.IR パーマリンク