IXA/Cogcomp at SemEval-2023 Task 2: Context-enriched Multilingual Named Entity Recognition using Knowledge Bases

要約

タイトル:知識ベースを利用したコンテキスト強化型多言語固有表現認識のIXA/Cogcomp SemEval-2023タスク2における実現

要約:
– 固有表現認識(NER)は、自然言語処理の中核的タスクの1つで、プレトレーニング済み言語モデルが優れたパフォーマンスを発揮しています。
– しかし、CoNLL 2003などの標準ベンチマークでは、展開されたNERシステムが直面する多くの課題について、新興または複雑なエンティティを細かく分類する必要がある場合といった点に触れられていません。
– 本論文では、3つのステップからなる新しいNERカスケードアプローチを提案します。第1ステップでは、入力文の候補エンティティを識別します。第2ステップでは、各候補を既存の知識ベースにリンクさせます。第3ステップでは、各エンティティ候補の詳細なカテゴリを予測します。
– 外部の知識ベースが、細かく分類されたエンティティの正確な分類において有意な役割を果たすことを実証しています。
– 本システムは、高リソース言語の知識ベースを活用した低リソース言語の設定でも、MultiCoNER2共有タスクにおいて強力なパフォーマンスを発揮します。

要約(オリジナル)

Named Entity Recognition (NER) is a core natural language processing task in which pre-trained language models have shown remarkable performance. However, standard benchmarks like CoNLL 2003 do not address many of the challenges that deployed NER systems face, such as having to classify emerging or complex entities in a fine-grained way. In this paper we present a novel NER cascade approach comprising three steps: first, identifying candidate entities in the input sentence; second, linking the each candidate to an existing knowledge base; third, predicting the fine-grained category for each entity candidate. We empirically demonstrate the significance of external knowledge bases in accurately classifying fine-grained and emerging entities. Our system exhibits robust performance in the MultiCoNER2 shared task, even in the low-resource language setting where we leverage knowledge bases of high-resource languages.

arxiv情報

著者 Iker García-Ferrero,Jon Ander Campos,Oscar Sainz,Ander Salaberria,Dan Roth
発行日 2023-04-27 20:51:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL パーマリンク