USA: Universal Sentiment Analysis Model & Construction of Japanese Sentiment Text Classification and Part of Speech Dataset

要約

感情分析は、自然言語処理の分野において極めて重要なタスクです。
これには、テキストレベルの感情極性分類と単語レベルの品詞(POS)感情極性判定の両方が含まれます。
このような分析では、モデルがテキストを総合的に理解しながら、微妙な情報を抽出することが求められます。
大規模言語モデル (LLM) の台頭により、感情分析の新しい道が開かれました。
この論文は、個々の単語とテキスト全体の間の相互強化効果(MRE)を活用することによってパフォーマンスを向上させることを提案します。
単語の極性がパッセージの全体的な感情にどのような影響を与えるかを詳しく掘り下げています。
私たちの研究をサポートするために、既存の感情分類データセットに基づいて、4 つの新しい感情テキスト分類および品詞 (SCPOS) データセットに注釈を付けました。
さらに、70億のパラメータサイズを備えたUniversal Sentiment Analysis(USA)モデルを開発しました。
実験結果から、私たちのモデルは 4 つのデータセットすべてで gpt-3.5-turbo のパフォーマンスを上回っていることが明らかになり、センチメント分析における MRE の重要性が強調されました。

要約(オリジナル)

Sentiment analysis is a pivotal task in the domain of natural language processing. It encompasses both text-level sentiment polarity classification and word-level Part of Speech(POS) sentiment polarity determination. Such analysis challenges models to understand text holistically while also extracting nuanced information. With the rise of Large Language Models(LLMs), new avenues for sentiment analysis have opened. This paper proposes enhancing performance by leveraging the Mutual Reinforcement Effect(MRE) between individual words and the overall text. It delves into how word polarity influences the overarching sentiment of a passage. To support our research, we annotated four novel Sentiment Text Classification and Part of Speech(SCPOS) datasets, building upon existing sentiment classification datasets. Furthermore, we developed a Universal Sentiment Analysis(USA) model, with a 7-billion parameter size. Experimental results revealed that our model surpassed the performance of gpt-3.5-turbo across all four datasets, underscoring the significance of MRE in sentiment analysis.

arxiv情報

著者 Chengguang Gan,Qinghao Zhang,Tatsunori Mori
発行日 2023-09-14 05:53:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク