要約
研究者は通常、特定のトピック、テーマ、イベントに焦点を当てたツイート、Reddit の投稿、新聞の見出しなどの短いテキストの大規模なコレクションに対して感情分析を実行します。
通常、汎用的な感情分析手法が使用されますが、平均的には良好なパフォーマンスを示しますが、さまざまなコンテキストで発生する意味の変化が見逃されます。たとえば、「アクティブ」という単語は、「アクティブなライフスタイル」と「アクティブなライフスタイル」というフレーズでは、まったく異なる意図と意味を持ちます。
活火山’。
この研究では、文脈に応じた感情分析を実行する新しいアプローチである CIDER (Context Informed Dictionary and sEntiment Reasoner) を紹介します。感情を含む用語の価数は、個々のテキストのスコア付けに使用される前にコーパス全体から推測されます。
この論文では、CIDER アルゴリズムについて詳しく説明し、このアルゴリズムが天気に関するツイートの大規模なコレクションに対する最先端のジェネラリスト感情分析よりも優れたパフォーマンスを発揮することを実証します。
CIDER の実装を Python パッケージとして利用できるようにしました: https://pypi.org/project/ciderpolarity/。
要約(オリジナル)
Researchers commonly perform sentiment analysis on large collections of short texts like tweets, Reddit posts or newspaper headlines that are all focused on a specific topic, theme or event. Usually, general purpose sentiment analysis methods are used which perform well on average but miss the variation in meaning that happens across different contexts, for example, the word ‘active’ has a very different intention and valence in the phrase ‘active lifestyle’ versus ‘active volcano’. This work presents a new approach, CIDER (Context Informed Dictionary and sEntiment Reasoner), which performs context sensitive sentiment analysis, where the valence of sentiment laden terms is inferred from the whole corpus before being used to score the individual texts. In this paper we detail the CIDER algorithm and demonstrate that it outperforms state-of-the-art generalist sentiment analysis on a large collection of tweets about the weather. We have made our implementation of CIDER available as a python package: https://pypi.org/project/ciderpolarity/.
arxiv情報
| 著者 | James C. Young,Rudy Arthur,Hywel T. P. Williams | 
| 発行日 | 2023-10-12 16:06:19+00:00 | 
| arxivサイト | arxiv_id(pdf) | 
提供元, 利用サービス
arxiv.jp, Google
