Emotion Detection in Reddit: Comparative Study of Machine Learning and Deep Learning Techniques

要約

感情の検出は、行動、人間関係、意思決定プロセスに大きな影響を与えるため、人間のコミュニケーションにおいて極めて重要です。
この研究では、Reddit のコメントに 27 の異なる感情の注釈を付ける GoEmotions データセットを活用して、テキストベースの感情検出に焦点を当てています。
これらの感情は、エクマンの 6 つの基本カテゴリ (喜び、怒り、恐怖、悲しみ、嫌悪、驚き) にマッピングされます。
このタスクには、6 つの機械学習モデル、3 つのアンサンブル モデル、および感情検出に最適なモデルを決定するための長期短期記憶 (LSTM) モデルを含むさまざまなモデルを採用しました。
結果は、スタッキング分類器が精度とパフォーマンスの点で他のモデルよりも優れていることを示しています。
また、スタッキング分類器の方が効果的であることが証明されており、事前トレーニング済みの感情検出モデルである EmoBERTa に対してモデルのベンチマークを行っています。
最後に、Stacking 分類器は Streamlit Web アプリケーション経由で展開され、テキストベースの感情分析における現実世界のアプリケーションへの可能性を強調しています。

要約(オリジナル)

Emotion detection is pivotal in human communication, as it significantly influences behavior, relationships, and decision-making processes. This study concentrates on text-based emotion detection by leveraging the GoEmotions dataset, which annotates Reddit comments with 27 distinct emotions. These emotions are subsequently mapped to Ekman’s six basic categories: joy, anger, fear, sadness, disgust, and surprise. We employed a range of models for this task, including six machine learning models, three ensemble models, and a Long Short-Term Memory (LSTM) model to determine the optimal model for emotion detection. Results indicate that the Stacking classifier outperforms other models in accuracy and performance. We also benchmark our models against EmoBERTa, a pre-trained emotion detection model, with our Stacking classifier proving more effective. Finally, the Stacking classifier is deployed via a Streamlit web application, underscoring its potential for real-world applications in text-based emotion analysis.

arxiv情報

著者 Maliheh Alaeddini
発行日 2024-11-15 16:28:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク