LLM-RM at SemEval-2023 Task 2: Multilingual Complex NER using XLM-RoBERTa

要約

【タイトル】XLM-RoBERTaを使った多言語の複雑な固有表現認識におけるLLM-RMのSemEval-2023 Task 2

【要約】
– 本論文は、文中のトークンレベルでの固有表現を認識するNamed Entity Recognition(NER)タスクにおける多言語設定における複雑な固有表現を解決することに焦点を当てている。
– LLM-RMチームは最近開催されたSemEval 2023タスクTask 2:MultiCoNER II、多言語の複雑な固有表現認識に参加した。
– 我々は、提供された12の言語のデータセットを用いてXLM-Robertaベースモデルをファインチューニングすることにより、クロスリンガル表現を活用して問題に取り組んでいる。
– 提供された12の言語は、Bangla、Chinese、English、Farsi、French、German、Hindi、Italian、Portuguese、Spanish、Swedish、Ukrainianである。

要約(オリジナル)

Named Entity Recognition(NER) is a task of recognizing entities at a token level in a sentence. This paper focuses on solving NER tasks in a multilingual setting for complex named entities. Our team, LLM-RM participated in the recently organized SemEval 2023 task, Task 2: MultiCoNER II,Multilingual Complex Named Entity Recognition. We approach the problem by leveraging cross-lingual representation provided by fine-tuning XLM-Roberta base model on datasets of all of the 12 languages provided — Bangla, Chinese, English, Farsi, French, German, Hindi, Italian, Portuguese, Spanish, Swedish and Ukrainian

arxiv情報

著者 Rahul Mehta,Vasudeva Varma
発行日 2023-05-05 06:05:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL パーマリンク