Political Sentiment Analysis of Persian Tweets Using CNN-LSTM Model

要約

感情分析は、さまざまなトピックに関する人々の感情や意見を特定し、分類するプロセスです。
Twitter 感情の分析は、近年ますます人気のあるトピックになっています。
この論文では、ペルシャの政治ツイートの感情を分析するためのいくつかの機械学習と深層学習モデルを紹介します。
私たちの分析は、単語表現に Bag of Words と ParsBERT を使用して実行されました。
ツイートの極性を分類するために、ガウス単純ベイズ、勾配ブースティング、ロジスティック回帰、デシジョン ツリー、ランダム フォレスト、および CNN と LSTM の組み合わせを適用しました。
この研究の結果は、ParsBERT 埋め込みによる深層学習が機械学習よりも優れたパフォーマンスを発揮することを示しています。
CNN-LSTM モデルは、最初のデータセットで 89 パーセント、2 番目のデータセットで 71 パーセントという最も高い分類精度を示しました。
ペルシア語は複雑であるため、このレベルの効率を達成するのは困難な作業でした。
私たちの研究の主な目的は、モデルのパフォーマンスを維持しながらトレーニング時間を短縮することでした。
その結果、モデルのアーキテクチャとパラメータにいくつかの調整が加えられました。
目的を達成したことに加えて、パフォーマンスもわずかに向上しました。

要約(オリジナル)

Sentiment analysis is the process of identifying and categorizing people’s emotions or opinions regarding various topics. The analysis of Twitter sentiment has become an increasingly popular topic in recent years. In this paper, we present several machine learning and a deep learning model to analysis sentiment of Persian political tweets. Our analysis was conducted using Bag of Words and ParsBERT for word representation. We applied Gaussian Naive Bayes, Gradient Boosting, Logistic Regression, Decision Trees, Random Forests, as well as a combination of CNN and LSTM to classify the polarities of tweets. The results of this study indicate that deep learning with ParsBERT embedding performs better than machine learning. The CNN-LSTM model had the highest classification accuracy with 89 percent on the first dataset and 71 percent on the second dataset. Due to the complexity of Persian, it was a difficult task to achieve this level of efficiency. The main objective of our research was to reduce the training time while maintaining the model’s performance. As a result, several adjustments were made to the model architecture and parameters. In addition to achieving the objective, the performance was slightly improved as well.

arxiv情報

著者 Mohammad Dehghani,Zahra Yazdanparast
発行日 2023-08-29 16:55:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.IR パーマリンク