要約
App Storeレビューでの粒状感情分類の精度を向上させるために、大規模な言語モデル(LLMS)を使用して、チェーンオブ思考(COT)の使用を調査します。
従来の数値および極性ベースの評価は、ユーザーフィードバックに組み込まれた微妙な感情をキャプチャできないことがよくあります。
各メソッドの予測を人間の判断と比較することにより、2000年のAmazonアプリレビューのCOTプロンプトと単純なプロンプトの有効性を評価しました。
COTは、センチメント分析のパフォーマンスを向上させる際の明示的な推論の利点を強調する84%から93%に分類精度を改善しました。
要約(オリジナル)
We explore the use of Chain-of-Thought (CoT) prompting with large language models (LLMs) to improve the accuracy of granular sentiment categorization in app store reviews. Traditional numeric and polarity-based ratings often fail to capture the nuanced sentiment embedded in user feedback. We evaluated the effectiveness of CoT prompting versus simple prompting on 2000 Amazon app reviews by comparing each method’s predictions to human judgements. CoT prompting improved classification accuracy from 84% to 93% highlighting the benefit of explicit reasoning in enhancing sentiment analysis performance.
arxiv情報
著者 | Vihaan Miriyala,Smrithi Bukkapatnam,Lavanya Prahallad |
発行日 | 2025-05-07 05:13:15+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google