IXA/Cogcomp at SemEval-2023 Task 2: Context-enriched Multilingual Named Entity Recognition using Knowledge Bases

要約

タイトル:IXA / Cogcomp at SemEval-2023 Task 2:Knowledge Basesを使用したコンテキスト豊かな多言語命名エンティティ認識

要旨:

– 名前付きエンティティ認識(NER)は、事前にトレーニングされた言語モデルが優れたパフォーマンスを発揮している自然言語処理の中核的なタスクです。
– しかし、CoNLL 2003などの標準的なベンチマークは、新興または複雑なエンティティを細かく分類する必要があるなど、NBRシステムが直面する多くの課題に対処していません。
– 本論文では、3つのステップから構成される新しいNERカスケードアプローチを提案しています。第一に、入力文で候補エンティティを特定します。第二に、それぞれの候補を既存の知識ベースにリンクします。第三に、各エンティティ候補の細かいカテゴリを予測します。
– 外部知識ベースが、細かいグレードのエンティティを正確に分類する上で重要であることを実証しています。
– 当社のシステムは、高リソース言語の知識ベースを活用する低リソース言語設定でも、MultiCoNER2共有タスクで堅牢なパフォーマンスを発揮しています。

要約(オリジナル)

Named Entity Recognition (NER) is a core natural language processing task in which pre-trained language models have shown remarkable performance. However, standard benchmarks like CoNLL 2003 \cite{conll03} do not address many of the challenges that deployed NER systems face, such as having to classify emerging or complex entities in a fine-grained way. In this paper we present a novel NER cascade approach comprising three steps: first, identifying candidate entities in the input sentence; second, linking the each candidate to an existing knowledge base; third, predicting the fine-grained category for each entity candidate. We empirically demonstrate the significance of external knowledge bases in accurately classifying fine-grained and emerging entities. Our system exhibits robust performance in the MultiCoNER2 \cite{multiconer2-data} shared task, even in the low-resource language setting where we leverage knowledge bases of high-resource languages.

arxiv情報

著者 Iker García-Ferrero,Jon Ander Campos,Oscar Sainz,Ander Salaberria,Dan Roth
発行日 2023-04-20 20:30:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL パーマリンク