要約
エンティティ指向のニューラル IR モデルは大幅に進歩しましたが、重要なニュアンスを見落としがちです。それは、文書内の個々のエンティティが文書全体の関連性に対して与える影響の程度が異なるということです。
このギャップに対処するために、エンティティ指向の高密度ドキュメントの再ランキング モデルである DREQ を紹介します。
独自の方法として、文書表現内のクエリに関連するエンティティを強調し、同時に関連性の低いエンティティを弱めることで、クエリ固有のエンティティ中心の文書表現を取得します。
次に、このエンティティ中心の文書表現と文書中心のテキスト表現を組み合わせて、文書の「ハイブリッド」表現を取得します。
このハイブリッド表現を使用して、ドキュメントの関連性スコアを学習します。
4 つの大規模ベンチマークを使用して、DREQ が最先端のニューラルおよび非ニューラル再ランキング手法を上回るパフォーマンスを示し、エンティティ指向表現アプローチの有効性を強調しています。
要約(オリジナル)
While entity-oriented neural IR models have advanced significantly, they often overlook a key nuance: the varying degrees of influence individual entities within a document have on its overall relevance. Addressing this gap, we present DREQ, an entity-oriented dense document re-ranking model. Uniquely, we emphasize the query-relevant entities within a document’s representation while simultaneously attenuating the less relevant ones, thus obtaining a query-specific entity-centric document representation. We then combine this entity-centric document representation with the text-centric representation of the document to obtain a ‘hybrid’ representation of the document. We learn a relevance score for the document using this hybrid representation. Using four large-scale benchmarks, we show that DREQ outperforms state-of-the-art neural and non-neural re-ranking methods, highlighting the effectiveness of our entity-oriented representation approach.
arxiv情報
著者 | Shubham Chatterjee,Iain Mackie,Jeff Dalton |
発行日 | 2024-01-11 14:27:12+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google