DREQ: Document Re-Ranking Using Entity-based Query Understanding


エンティティ指向のニューラル IR モデルは大幅に進歩しましたが、重要なニュアンスを見落としがちです。それは、文書内の個々のエンティティが文書全体の関連性に対して与える影響の程度が異なるということです。
このギャップに対処するために、エンティティ指向の高密度ドキュメントの再ランキング モデルである DREQ を紹介します。
4 つの大規模ベンチマークを使用して、DREQ が最先端のニューラルおよび非ニューラル再ランキング手法を上回るパフォーマンスを示し、エンティティ指向表現アプローチの有効性を強調しています。


While entity-oriented neural IR models have advanced significantly, they often overlook a key nuance: the varying degrees of influence individual entities within a document have on its overall relevance. Addressing this gap, we present DREQ, an entity-oriented dense document re-ranking model. Uniquely, we emphasize the query-relevant entities within a document’s representation while simultaneously attenuating the less relevant ones, thus obtaining a query-specific entity-centric document representation. We then combine this entity-centric document representation with the text-centric representation of the document to obtain a ‘hybrid’ representation of the document. We learn a relevance score for the document using this hybrid representation. Using four large-scale benchmarks, we show that DREQ outperforms state-of-the-art neural and non-neural re-ranking methods, highlighting the effectiveness of our entity-oriented representation approach.


著者 Shubham Chatterjee,Iain Mackie,Jeff Dalton
発行日 2024-01-11 14:27:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.IR パーマリンク