要約
ゼロショット エンティティ リンク (EL) は、エンティティへの言及を目に見えないエンティティに合わせて一般化能力に挑戦することを目的としています。
これまでの方法は主に候補の検索段階に焦点を当てており、エンティティ間の曖昧さをなくし、最終的なリンク予測を行う重要な候補のランク付け段階を無視していました。
この論文では、エンティティの曖昧さ回避の主要コンポーネント、つまり言及エンティティのマッチングとエンティティ間の比較をモデル化することにより、読み取りと選択 (ReS) フレームワークを提案します。
まず、各候補について、読み取りモジュールが言及コンテキストを活用して言及を認識するエンティティ表現を出力し、言及とエンティティのマッチングを可能にします。
次に、選択モジュールで、候補の選択を配列ラベル付け問題としてフレーム化し、すべての候補表現を融合してエンティティ間比較を可能にします。
私たちの手法は、確立されたゼロショット EL データセット ZESHEL 上で 2.55% のマイクロ平均精度向上で最先端のパフォーマンスを達成し、これまでの研究のほとんどで使用されていた面倒なマルチフェーズの事前トレーニングは必要ありません。
言及エンティティとエンティティ間の対話の両方の有効性を示しています。
要約(オリジナル)
Zero-shot entity linking (EL) aims at aligning entity mentions to unseen entities to challenge the generalization ability. Previous methods largely focus on the candidate retrieval stage and ignore the essential candidate ranking stage, which disambiguates among entities and makes the final linking prediction. In this paper, we propose a read-and-select (ReS) framework by modeling the main components of entity disambiguation, i.e., mention-entity matching and cross-entity comparison. First, for each candidate, the reading module leverages mention context to output mention-aware entity representations, enabling mention-entity matching. Then, in the selecting module, we frame the choice of candidates as a sequence labeling problem, and all candidate representations are fused together to enable cross-entity comparison. Our method achieves the state-of-the-art performance on the established zero-shot EL dataset ZESHEL with a 2.55% micro-average accuracy gain, with no need for laborious multi-phase pre-training used in most of the previous work, showing the effectiveness of both mention-entity and cross-entity interaction.
arxiv情報
著者 | Zhenran Xu,Yulin Chen,Baotian Hu,Min Zhang |
発行日 | 2023-10-29 14:58:54+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google