Survey of Aspect-based Sentiment Analysis Datasets

要約

アスペクトベースのセンチメント分析 (ABSA) は、ユーザー生成のレビューを分析して次のことを判断する必要がある自然言語処理の問題です。a) レビューされているターゲット エンティティ、b) それが属する高レベルのアスペクト、c) 表現されたセンチメント
目標と側面に向けて。
ABSA のコーパスは数多くありながら散在しているため、研究者が特定の ABSA サブタスクに最適なコーパスを迅速に特定することが困難になっています。
この研究は、自律 ABSA システムの訓練と評価に使用できるコーパスのデータベースを提示することを目的としています。
さらに、ABSA の主要なコーパスとそのサブタスクの概要を示し、研究者がコーパスを選択する際に考慮すべきいくつかの特徴を強調します。
最後に、現在の収集アプローチの長所と短所について議論し、将来のコーパス作成についての推奨事項を示します。
この調査では、25 を超えるドメインをカバーする 65 の公開されている ABSA データセットを調査します (45 の英語データセットと 20 の他の言語のデータセットを含む)。

要約(オリジナル)

Aspect-based sentiment analysis (ABSA) is a natural language processing problem that requires analyzing user-generated reviews to determine: a) The target entity being reviewed, b) The high-level aspect to which it belongs, and c) The sentiment expressed toward the targets and the aspects. Numerous yet scattered corpora for ABSA make it difficult for researchers to identify corpora best suited for a specific ABSA subtask quickly. This study aims to present a database of corpora that can be used to train and assess autonomous ABSA systems. Additionally, we provide an overview of the major corpora for ABSA and its subtasks and highlight several features that researchers should consider when selecting a corpus. Finally, we discuss the advantages and disadvantages of current collection approaches and make recommendations for future corpora creation. This survey examines 65 publicly available ABSA datasets covering over 25 domains, including 45 English and 20 other languages datasets.

arxiv情報

著者 Siva Uday Sampreeth Chebolu,Franck Dernoncourt,Nedim Lipka,Thamar Solorio
発行日 2023-09-21 17:35:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク