Transformer-based Text Classification on Unified Bangla Multi-class Emotion Corpus

要約

この研究では、バングラ語のテキストから感情を特定し、抽出するための完全なアプローチを提案します。
私たちは、トランスフォーマーベースのモデルを使用してバングラ語から、怒り、嫌悪感、恐怖、喜び、悲しみ、驚きの 6 つのクラスに対するバングラ語感情分類子を提供します。これは、特に高リソース言語において、近年驚異的な結果を示しています。
Unified Bangla Multi-class Emotion Corpus (UBMEC) は、モデルのパフォーマンスを評価するために使用されます。
UBMEC は、以前にリリースされた 6 つの感情クラスに関するバングラ語コメントの手動でラベル付けされた 2 つのデータセットと、私たちが作成した新しい手動でラベル付けされたバングラ語コメントを組み合わせて作成されます。
この作業で使用したコーパス データセットとコードは公開されています。

要約(オリジナル)

In this research, we propose a complete set of approaches for identifying and extracting emotions from Bangla texts. We provide a Bangla emotion classifier for six classes: anger, disgust, fear, joy, sadness, and surprise, from Bangla words using transformer-based models, which exhibit phenomenal results in recent days, especially for high-resource languages. The Unified Bangla Multi-class Emotion Corpus (UBMEC) is used to assess the performance of our models. UBMEC is created by combining two previously released manually labeled datasets of Bangla comments on six emotion classes with fresh manually labeled Bangla comments created by us. The corpus dataset and code we used in this work are publicly available.

arxiv情報

著者 Md Sakib Ullah Sourav,Huidong Wang,Mohammad Sultan Mahmud,Hua Zheng
発行日 2023-06-13 07:18:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク