Hybrid Retrieval and Multi-stage Text Ranking Solution at TREC 2022 Deep Learning Track

要約

大規模テキスト検索テクノロジーは、さまざまな実際のビジネス シナリオで広く使用されています。
このペーパーでは、TREC 2022 ディープラーニング トラック用のシステムを紹介します。
私たちのソリューションで採用されているハイブリッドテキスト検索と多段階テキストランキング手法について説明します。
検索段階では、従来のスパース検索とニューラルデンス検索の 2 つの構造を組み合わせました。
ランキング段階では、大規模な事前トレーニング済み言語モデルに基づいて構築された完全なインタラクションベースのランキングモデルに加えて、最終的なテキストランキングのパフォーマンスをさらに強化する軽量のサブランキングモジュールも提案します。
評価結果は、提案したアプローチの有効性を示しています。
私たちのモデルは、パッセージランキングとドキュメントランキングのテストセットでそれぞれ 1 位と 4 位を獲得しました。

要約(オリジナル)

Large-scale text retrieval technology has been widely used in various practical business scenarios. This paper presents our systems for the TREC 2022 Deep Learning Track. We explain the hybrid text retrieval and multi-stage text ranking method adopted in our solution. The retrieval stage combined the two structures of traditional sparse retrieval and neural dense retrieval. In the ranking stage, in addition to the full interaction-based ranking model built on large pre-trained language model, we also proposes a lightweight sub-ranking module to further enhance the final text ranking performance. Evaluation results demonstrate the effectiveness of our proposed approach. Our models achieve the 1st and 4th rank on the test set of passage ranking and document ranking respectively.

arxiv情報

著者 Guangwei Xu,Yangzhao Zhang,Longhui Zhang,Dingkun Long,Pengjun Xie,Ruijie Guo
発行日 2023-08-23 09:56:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.IR パーマリンク