要約
テキストに基づく感情分類は、近年関心が高まっている多くのアプリケーションを備えたタスクです。
この論文では、研究者や実務家が比較的新しいデータセットや一般的な感情分類についての洞察を得られるようにすることを目的とした予備研究を紹介します。
関連する文献で最近発表された 3 つのデータセットに焦点を当て、データにさまざまな特性が存在する場合の従来の深層学習モデルと最先端の深層学習モデルのパフォーマンスを調べます。
また、パフォーマンスを向上させるためのデータ拡張の使用についても検討します。
私たちの実験的作業は、RoBERTa などの最先端のモデルがすべてのケースで最高のパフォーマンスを発揮することを示しています。
また、これらのデータセットの感情分類の複雑さを強調する観察と議論を提供し、収集してラベル付けした実際のソーシャル メディア投稿へのモデルの適用性をテストします。
要約(オリジナル)
Emotion Classification based on text is a task with many applications which has received growing interest in recent years. This paper presents a preliminary study with the goal to help researchers and practitioners gain insight into relatively new datasets as well as emotion classification in general. We focus on three datasets that were recently presented in the related literature, and we explore the performance of traditional as well as state-of-the-art deep learning models in the presence of different characteristics in the data. We also explore the use of data augmentation in order to improve performance. Our experimental work shows that state-of-the-art models such as RoBERTa perform the best for all cases. We also provide observations and discussion that highlight the complexity of emotion classification in these datasets and test out the applicability of the models to actual social media posts we collected and labeled.
arxiv情報
著者 | Anna Koufakou,Jairo Garciga,Adam Paul,Joseph Morelli,Christopher Frank |
発行日 | 2023-02-28 16:34:55+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google