CIDER: Context sensitive sentiment analysis for short-form text

要約

研究者は通常、特定のトピック、テーマ、イベントに焦点を当てたツイート、Reddit の投稿、新聞の見出しなどの短いテキストの大規模なコレクションに対して感情分析を実行します。
通常は、汎用の感情分析手法が使用されます。
これらは平均的には良好なパフォーマンスを示しますが、さまざまな文脈で生じる意味の変化を見逃しています。たとえば、「アクティブ」という単語は、「アクティブなライフスタイル」と「活火山」というフレーズでは、非常に異なる意図と意味を持っています。
この研究では、文脈に応じた言語分析を実行する新しいアプローチである CIDER (Context Informed Dictionary and sEmantic Reasoner) を紹介します。このアプローチでは、個々のテキストのスコア付けに使用される前に、感情を含む用語の価数がコーパス全体から推測されます。
この論文では、CIDER アルゴリズムについて詳しく説明し、天気に関するツイートの大規模なコレクションに対して、このアルゴリズムが最先端のジェネラリストの教師なしセンチメント分析手法よりも優れたパフォーマンスを発揮することを実証します。
CIDER は、代替 (非感情) 言語スケールにも適用できます。
英国におけるジェンダーに関する事例研究が紹介され、ジェンダー意識が高く、感情が高揚した日が特定されています。
CIDER の実装を Python パッケージとして利用できるようにしました: https://pypi.org/project/ciderpolarity/。

要約(オリジナル)

Researchers commonly perform sentiment analysis on large collections of short texts like tweets, Reddit posts or newspaper headlines that are all focused on a specific topic, theme or event. Usually, general-purpose sentiment analysis methods are used. These perform well on average but miss the variation in meaning that happens across different contexts, for example, the word ‘active’ has a very different intention and valence in the phrase ‘active lifestyle’ versus ‘active volcano’. This work presents a new approach, CIDER (Context Informed Dictionary and sEmantic Reasoner), which performs context-sensitive linguistic analysis, where the valence of sentiment-laden terms is inferred from the whole corpus before being used to score the individual texts. In this paper, we detail the CIDER algorithm and demonstrate that it outperforms state-of-the-art generalist unsupervised sentiment analysis techniques on a large collection of tweets about the weather. CIDER is also applicable to alternative (non-sentiment) linguistic scales. A case study on gender in the UK is presented, with the identification of highly gendered and sentiment-laden days. We have made our implementation of CIDER available as a Python package: https://pypi.org/project/ciderpolarity/.

arxiv情報

著者 James C. Young,Rudy Arthur,Hywel T. P. Williams
発行日 2024-07-10 10:39:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク