SemEval-2023 Task 12: Sentiment Analysis for African Languages (AfriSenti-SemEval)

要約

【タイトル】
SemEval-2023 タスク12:アフリカ言語の感情分析 (AfriSenti-SemEval)

【要約】
・アフリカの言語に焦点を当てた初めてのSemEval共有タスク「AfriSenti-SemEval」を紹介。
・タスクは、3つの感情クラスにラベル付けされた14のアフリカ言語(Amharic、Algerian Arabic、Hausa、Igbo、Kinyarwanda、Moroccan Arabic、Mozambican Portuguese、Nigerian Pidgin、Oromo、Swahili、Tigrinya、Twi、Xitsonga、Yorùbá)の感情分類の課題。
・3つのサブタスクがある:(1) 単一言語分類「Task A」、(2) 多言語分類「Task B」、(3) ゼロショット分類「Task C」
・Task AとBの最高のパフォーマンスは、それぞれ71.31、75.06の重み付きF1でNLNDEチームによって達成された。Task Cでは、UCAS-IIE-NLPが58.15の重み付きF1で最高の平均スコアを達成した。
・最高の10つのシステムと彼らのアプローチについて述べる。

要約(オリジナル)

We present the first Africentric SemEval Shared task, Sentiment Analysis for African Languages (AfriSenti-SemEval) – The dataset is available at https://github.com/afrisenti-semeval/afrisent-semeval-2023. AfriSenti-SemEval is a sentiment classification challenge in 14 African languages: Amharic, Algerian Arabic, Hausa, Igbo, Kinyarwanda, Moroccan Arabic, Mozambican Portuguese, Nigerian Pidgin, Oromo, Swahili, Tigrinya, Twi, Xitsonga, and Yor\`ub\’a (Muhammad et al., 2023), using data labeled with 3 sentiment classes. We present three subtasks: (1) Task A: monolingual classification, which received 44 submissions; (2) Task B: multilingual classification, which received 32 submissions; and (3) Task C: zero-shot classification, which received 34 submissions. The best performance for tasks A and B was achieved by NLNDE team with 71.31 and 75.06 weighted F1, respectively. UCAS-IIE-NLP achieved the best average score for task C with 58.15 weighted F1. We describe the various approaches adopted by the top 10 systems and their approaches.

arxiv情報

著者 Shamsuddeen Hassan Muhammad,Idris Abdulmumin,Seid Muhie Yimam,David Ifeoluwa Adelani,Ibrahim Sa’id Ahmad,Nedjma Ousidhoum,Abinew Ayele,Saif M. Mohammad,Meriem Beloucif,Sebastian Ruder
発行日 2023-05-01 10:18:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL パーマリンク