KINLP at SemEval-2023 Task 12: Kinyarwanda Tweet Sentiment Analysis

要約

【タイトル】
SemEval-2023 タスク12におけるKINLP: キニヤルワンダ語ツイートの感情分析

【要約】
– 本論文では、著者がアフリカ諸言語の感情分析タスクであるSemEval-2023タスク12に応募したシステムについて述べられている。
– このシステムは、キニヤルワンダ語に焦点を当て、言語固有のモデルを使用している。
– キニヤルワンダ語の形態は、2段階のトランスフォーマーアーキテクチャでモデル化され、トランスフォーマーモデルは、マルチタスクマスクされた形態予測を使用して大規模なテキストコーパスで事前にトレーニングされる。
– このモデルは、機械学習コードを書く必要がない実験用プラットフォーム上に展開され、事前トレーニングされた言語モデルの微調整をユーザーが実験することができる。
– シェアードタスクへの最終提出は、34チーム中2位の成績を収め、加重F1スコアが72.50%を獲得した。
– 評価結果の分析では、タスクの高い精度を達成するための課題と改善すべき領域が特定された。

要約(オリジナル)

This paper describes the system entered by the author to the SemEval-2023 Task 12: Sentiment analysis for African languages. The system focuses on the Kinyarwanda language and uses a language-specific model. Kinyarwanda morphology is modeled in a two tier transformer architecture and the transformer model is pre-trained on a large text corpus using multi-task masked morphology prediction. The model is deployed on an experimental platform that allows users to experiment with the pre-trained language model fine-tuning without the need to write machine learning code. Our final submission to the shared task achieves second ranking out of 34 teams in the competition, achieving 72.50% weighted F1 score. Our analysis of the evaluation results highlights challenges in achieving high accuracy on the task and identifies areas for improvement.

arxiv情報

著者 Antoine Nzeyimana
発行日 2023-04-25 04:30:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL, I.2.7 パーマリンク