ILCiteR: Evidence-grounded Interpretable Local Citation Recommendation

要約

ローカル引用推奨のための既存の機械学習アプローチは、クエリ (通常はクレームやエンティティへの言及) を引用に値する研究論文に直接マッピングまたは翻訳します。
このような定式化では、特定のクエリに対して特定の研究論文を引用する必要がある理由を正確に特定することが困難であり、推奨事項の解釈可能性が制限されます。
これを軽減するために、証拠に基づいたローカル引用推奨タスクを導入します。このタスクでは、ターゲット潜在空間が特定の論文を推奨するための証拠スパンで構成されます。
私たちが提案するシステム ILCiteR は、遠隔監視された証拠検索と複数段階の再ランキング フレームワークを使用して、既存の研究文献から抽出された同様の証拠範囲に基づいて、クエリに引用する論文を推奨します。
単純に推奨事項を出力するこれまでの定式化とは異なり、ILCiteR はエビデンス スパンと推奨論文ペアのランク付けされたリストを取得します。
第二に、以前に提案された引用推奨用のニューラル モデルでは、理想的には候補論文のプールが大幅に更新されるたびに、大量のラベル付きデータに対する高価なトレーニングが必要です。
対照的に、ILCiteR は、モデルのトレーニングを行わず、動的な証拠データベースと事前トレーニングされた Transformer ベースの言語モデルからの遠隔監視のみに依存します。
我々は、証拠に基づいたローカル引用推奨タスクに新しいデータセットを提供し、証拠スパンを再ランク付けするための提案された条件付きニューラルランクアンサンブルアプローチの有効性を実証します。

要約(オリジナル)

Existing Machine Learning approaches for local citation recommendation directly map or translate a query, which is typically a claim or an entity mention, to citation-worthy research papers. Within such a formulation, it is challenging to pinpoint why one should cite a specific research paper for a particular query, leading to limited recommendation interpretability. To alleviate this, we introduce the evidence-grounded local citation recommendation task, where the target latent space comprises evidence spans for recommending specific papers. Using a distantly-supervised evidence retrieval and multi-step re-ranking framework, our proposed system, ILCiteR, recommends papers to cite for a query grounded on similar evidence spans extracted from the existing research literature. Unlike past formulations that simply output recommendations, ILCiteR retrieves ranked lists of evidence span and recommended paper pairs. Secondly, previously proposed neural models for citation recommendation require expensive training on massive labeled data, ideally after every significant update to the pool of candidate papers. In contrast, ILCiteR relies solely on distant supervision from a dynamic evidence database and pre-trained Transformer-based Language Models without any model training. We contribute a novel dataset for the evidence-grounded local citation recommendation task and demonstrate the efficacy of our proposed conditional neural rank-ensembling approach for re-ranking evidence spans.

arxiv情報

著者 Sayar Ghosh Roy,Jiawei Han
発行日 2024-03-13 17:38:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.IR パーマリンク