要約
検索の学習は、自律的に検索ボックスを使用して情報を検索することを学習する人工エージェントを構築するタスクです。
これまでのところ、現在の言語モデルは、従来の用語ベースの検索と組み合わせて、シンボリック クエリの再構築ポリシーを学習できることが示されていますが、優れたニューラル レトリーバーには及ばないことが示されています。
デュアルエンコーダーを介した最初のパスの取得ステップの後、個別のクエリ絞り込み操作を受け入れるハイブリッド環境にセットアップを検索するための以前の学習を拡張します。
BEIR タスクの実験では、行動クローニングによってトレーニングされた検索エージェントが、デュアル エンコーダー リトリーバーとクロス エンコーダー リランカーの組み合わせに基づく基本的な検索システムよりも優れていることが示されています。
さらに、単純なヒューリスティック ハイブリッド検索環境 (HRE) を使用すると、ベースライン パフォーマンスを数 nDCG ポイント向上させることができます。
HRE (HARE) に基づく検索エージェントは、解釈可能なアクションを介して、2 倍の速度で、ゼロ ショットとドメイン内評価の両方でバランスのとれた最先端のパフォーマンスに一致します。
要約(オリジナル)
Learning to search is the task of building artificial agents that learn to autonomously use a search box to find information. So far, it has been shown that current language models can learn symbolic query reformulation policies, in combination with traditional term-based retrieval, but fall short of outperforming neural retrievers. We extend the previous learning to search setup to a hybrid environment, which accepts discrete query refinement operations, after a first-pass retrieval step via a dual encoder. Experiments on the BEIR task show that search agents, trained via behavioral cloning, outperform the underlying search system based on a combined dual encoder retriever and cross encoder reranker. Furthermore, we find that simple heuristic Hybrid Retrieval Environments (HRE) can improve baseline performance by several nDCG points. The search agent based on HRE (HARE) matches state-of-the-art performance, balanced in both zero-shot and in-domain evaluations, via interpretable actions, and at twice the speed.
arxiv情報
著者 | Michelle Chen Huebscher,Christian Buck,Massimiliano Ciaramita,Sascha Rothe |
発行日 | 2023-03-29 13:29:35+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google