Improving Few-shot and Zero-shot Entity Linking with Coarse-to-Fine Lexicon-based Retriever

要約

フューショットおよびゼロショットのエンティティ リンクは、より困難ではありますが、現実世界のシナリオに近い、テールおよび新興エンティティに焦点を当てています。
主流の方法は、「検索と再ランク付け」の 2 段階のフレームワークです。
この論文では、効果的な方法でエンティティ候補を取得するための、粗いから細かいまでのレキシコンベースの検索器を提案します。この検索器は 2 つの層で動作します。
最初の層はエンティティ名を利用して粗粒度の候補を取得し、2 番目の層は粗粒度の候補の中から粒度の細かい候補に検索を絞り込みます。
さらに、この 2 番目の層はエンティティの説明を利用して、既存の人気エンティティと名前を共有する末尾エンティティまたは新しいエンティティを効果的に曖昧さなくします。
実験結果は、私たちのアプローチが検索段階で大規模な微調整を必要とせずに優れたパフォーマンスを達成できることを示しています。
特に、私たちのアプローチは、中国のフューショットおよびゼロショットエンティティリンクに関する NLPCC 2023 共有タスク 6 で 1 位にランクされています。

要約(オリジナル)

Few-shot and zero-shot entity linking focus on the tail and emerging entities, which are more challenging but closer to real-world scenarios. The mainstream method is the ”retrieve and rerank” two-stage framework. In this paper, we propose a coarse-to-fine lexicon-based retriever to retrieve entity candidates in an effective manner, which operates in two layers. The first layer retrieves coarse-grained candidates by leveraging entity names, while the second layer narrows down the search to fine-grained candidates within the coarse-grained ones. In addition, this second layer utilizes entity descriptions to effectively disambiguate tail or new entities that share names with existing popular entities. Experimental results indicate that our approach can obtain superior performance without requiring extensive finetuning in the retrieval stage. Notably, our approach ranks the 1st in NLPCC 2023 Shared Task 6 on Chinese Few-shot and Zero-shot Entity Linking.

arxiv情報

著者 Shijue Huang,Bingbing Wang,Libo Qin,Qin Zhao,Ruifeng Xu
発行日 2023-08-13 07:02:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク