要約
タイトル:知識ベースを使用したコンテキスト豊かな多言語名前付きエンティティ認識におけるIXA/CogcompのSemEval-2023タスク2
要約:
– Named Entity Recognition(NER)は、事前に学習された言語モデルが驚異的なパフォーマンスを示す、自然言語処理の中心的なタスクの1つです。
– しかし、CoNLL 2003などの標準ベンチマークは、新しいまたは複雑なエンティティを細かく分類するという展開されたNERシステムが直面する多くの課題に対処していないため、こうした課題を解決するために、新しいNERカスケードアプローチを提案します。
– これは、3つのステップで構成されており、1つ目は入力文の候補エンティティを識別すること、2つ目は各候補を既存の知識ベースにリンクすること、そして3つ目は各エンティティ候補の細かいカテゴリを予測することです。
– 外部知識ベースが、細分化されたエンティティの正確な分類に重要であることを実証しました。
– 我々のシステムは、ハイリソース言語の知識ベースを活用した低リソース言語設定でも、MultiCoNER2共有タスクで堅牢なパフォーマンスを発揮します。
要約(オリジナル)
Named Entity Recognition (NER) is a core natural language processing task in which pre-trained language models have shown remarkable performance. However, standard benchmarks like CoNLL 2003 do not address many of the challenges that deployed NER systems face, such as having to classify emerging or complex entities in a fine-grained way. In this paper we present a novel NER cascade approach comprising three steps: first, identifying candidate entities in the input sentence; second, linking the each candidate to an existing knowledge base; third, predicting the fine-grained category for each entity candidate. We empirically demonstrate the significance of external knowledge bases in accurately classifying fine-grained and emerging entities. Our system exhibits robust performance in the MultiCoNER2 shared task, even in the low-resource language setting where we leverage knowledge bases of high-resource languages.
arxiv情報
著者 | Iker García-Ferrero,Jon Ander Campos,Oscar Sainz,Ander Salaberria,Dan Roth |
発行日 | 2023-04-24 10:21:20+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI