TempRetriever: Fusion-based Temporal Dense Passage Retrieval for Time-Sensitive Questions

要約

時間的認識は、多くの情報検索タスク、特にドキュメントの関連性がクエリの時間コンテキストとの整合に依存するシナリオで重要です。
BM25や密な通過回収(DPR)などの従来のアプローチは、語彙的またはセマンティックな類似性に焦点を当てていますが、クエリとドキュメントの間の時間的整列を無視する傾向があります。
クエリ日付とドキュメントタイムスタンプの両方を検索プロセスに埋め込むことにより、一時的な情報を明示的に組み込むDPRの新しい拡張であるTempretrieverを提案します。
これにより、文脈的に関連するだけでなく、クエリの時間的意図と整合するパッセージを取得できます。
Tempretrieverを2つの大規模なデータセットArchivalqaとChroniclingAmericaqaで評価し、複数のメトリックにわたるベースライン検索モデルに対する優位性を示しています。
Tempretrieverは、Archivalqaの標準DPRと比較して、Top-1検索精度の6.63 \%の改善とNDCG@10の3.79%の改善を達成します。
同様に、ChroniclingAmericaqaの場合、Tempretrieverは、NDCG@10のTop-1検索精度の9.56 \%の改善と4.68 \%の改善を示します。
また、トレーニング中の時間的不整合に対処することにより、回収パフォーマンスをさらに強化する新しい時間ベースのネガティブサンプリング戦略を提案します。
私たちの結果は、密な検索システムにおける時間的側面の重要性を強調し、時間を手にした通過回収のための新しいベンチマークを確立します。

要約(オリジナル)

Temporal awareness is crucial in many information retrieval tasks, particularly in scenarios where the relevance of documents depends on their alignment with the query’s temporal context. Traditional approaches such as BM25 and Dense Passage Retrieval (DPR) focus on lexical or semantic similarity but tend to neglect the temporal alignment between queries and documents, which is essential for time-sensitive tasks like temporal question answering (TQA). We propose TempRetriever, a novel extension of DPR that explicitly incorporates temporal information by embedding both the query date and document timestamp into the retrieval process. This allows retrieving passages that are not only contextually relevant but also aligned with the temporal intent of queries. We evaluate TempRetriever on two large-scale datasets ArchivalQA and ChroniclingAmericaQA demonstrating its superiority over baseline retrieval models across multiple metrics. TempRetriever achieves a 6.63\% improvement in Top-1 retrieval accuracy and a 3.79\% improvement in NDCG@10 compared to the standard DPR on ArchivalQA. Similarly, for ChroniclingAmericaQA, TempRetriever exhibits a 9.56\% improvement in Top-1 retrieval accuracy and a 4.68\% improvement in NDCG@10. We also propose a novel, time-based negative sampling strategy which further enhances retrieval performance by addressing temporal misalignment during training. Our results underline the importance of temporal aspects in dense retrieval systems and establish a new benchmark for time-aware passage retrieval.

arxiv情報

著者 Abdelrahman Abdallah,Bhawna Piryani,Jonas Wallat,Avishek Anand,Adam Jatowt
発行日 2025-04-08 13:11:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.IR パーマリンク