Emotion Classification in Low and Moderate Resource Languages

要約

世界中の人々の感情状態を分析できることが重要です。
世界中で 7,100 以上のアクティブな言語が話されており、言語ごとに感情分類を構築するのは多大な労力を要します。
特にリソースが少なく、絶滅の危機に瀕している言語の場合、感情分類を構築するのは非常に困難な場合があります。
私たちは、リソースが豊富な言語 (つまり、私たちの研究では \textit{English}) で感情分類器をトレーニングし、その学習をリソースの少ない言語と中程度の言語に移す、言語間感情分類器を紹介します。
高リソース言語から低リソース言語または中程度リソース言語への転移学習の 2 つのアプローチを比較対照します。
1 つのアプローチは、並行コーパスで高リソース言語から低および中リソース言語にアノテーションを投影し、もう 1 つは高リソース言語から他の言語への直接転送を使用します。
ペルシア語、アラビア語、スペイン語、イロカノ語、オーディア語、アゼルバイジャン語の 6 つの言語に対するアプローチの有効性を示します。
私たちの結果は、私たちのアプローチがランダムなベースラインを上回り、言語間で感情をうまく伝達できることを示しています。
すべての言語において、言語を越えて感情を直接伝達する方がより良い結果をもたらします。
また、ペルシア語、アゼルバイジャン語、イロカノ語、オーディア語の 4 つの言語について、注釈付きの感情ラベル付きリソースも作成します。

要約(オリジナル)

It is important to be able to analyze the emotional state of people around the globe. There are 7100+ active languages spoken around the world and building emotion classification for each language is labor intensive. Particularly for low-resource and endangered languages, building emotion classification can be quite challenging. We present a cross-lingual emotion classifier, where we train an emotion classifier with resource-rich languages (i.e. \textit{English} in our work) and transfer the learning to low and moderate resource languages. We compare and contrast two approaches of transfer learning from a high-resource language to a low or moderate-resource language. One approach projects the annotation from a high-resource language to low and moderate-resource language in parallel corpora and the other one uses direct transfer from high-resource language to the other languages. We show the efficacy of our approaches on 6 languages: Farsi, Arabic, Spanish, Ilocano, Odia, and Azerbaijani. Our results indicate that our approaches outperform random baselines and transfer emotions across languages successfully. For all languages, the direct cross-lingual transfer of emotion yields better results. We also create annotated emotion-labeled resources for four languages: Farsi, Azerbaijani, Ilocano and Odia.

arxiv情報

著者 Shabnam Tafreshi,Shubham Vatsal,Mona Diab
発行日 2024-02-28 15:46:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク