A Deep Convolutional Neural Networks Based Multi-Task Ensemble Model for Aspect and Polarity Classification in Persian Reviews

要約

側面ベースの感情分析は、本文で説明されているすべての側面を識別できるため、非常に重要であり、応用されます。
ただし、側面ベースのセンチメント分析は、本文で説明されているすべての側面を特定することに加えて、その極性も特定できる場合に最も効果的です。
これまでの方法のほとんどはパイプライン アプローチを使用しています。つまり、最初に側面を特定し、次に極性を特定します。
このような方法はモデルエラーを引き起こす可能性があるため、実際のアプリケーションには適していません。
そこで本研究では、アスペクトカテゴリの検出とアスペクトカテゴリの極性の検出を同時に行える畳み込みニューラルネットワーク(CNN)に基づくマルチタスク学習モデルを提案する。
モデルを単独で作成すると、最良の予測が得られず、偏りや高い分散などのエラーが発生する可能性があります。
これらのエラーを軽減し、モデル予測の効率を向上させるには、アンサンブル学習として知られる複数のモデルを組み合わせることで、より良い結果が得られる可能性があります。
したがって、この記事の主な目的は、ペルシャ語のレビューにおける感情分析を強化するために、マルチタスクのディープ畳み込みニューラル ネットワークのアンサンブルに基づくモデルを作成することです。
映画ドメインのペルシア語データセットを使用して、提案された手法を評価しました。
開発されたモデルのパフォーマンスを評価するために、ジャカード指数とハミング損失測定が使用されました。
結果は、この新しいアプローチによりペルシア語の感情分析モデルの効率が向上することを示しています。

要約(オリジナル)

Aspect-based sentiment analysis is of great importance and application because of its ability to identify all aspects discussed in the text. However, aspect-based sentiment analysis will be most effective when, in addition to identifying all the aspects discussed in the text, it can also identify their polarity. Most previous methods use the pipeline approach, that is, they first identify the aspects and then identify the polarities. Such methods are unsuitable for practical applications since they can lead to model errors. Therefore, in this study, we propose a multi-task learning model based on Convolutional Neural Networks (CNNs), which can simultaneously detect aspect category and detect aspect category polarity. creating a model alone may not provide the best predictions and lead to errors such as bias and high variance. To reduce these errors and improve the efficiency of model predictions, combining several models known as ensemble learning may provide better results. Therefore, the main purpose of this article is to create a model based on an ensemble of multi-task deep convolutional neural networks to enhance sentiment analysis in Persian reviews. We evaluated the proposed method using a Persian language dataset in the movie domain. Jacquard index and Hamming loss measures were used to evaluate the performance of the developed models. The results indicate that this new approach increases the efficiency of the sentiment analysis model in the Persian language.

arxiv情報

著者 Milad Vazan,Fatemeh Sadat Masoumi,Sepideh Saeedi Majd
発行日 2023-08-29 17:54:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク