Survey of Aspect-based Sentiment Analysis Datasets

要約

タイトル:アスペクトベースの感情分析データセットの調査
要約:
– 「アスペクトベースの感情分析(ABSA)」は、ユーザーが生成したレビューを分析して、対象となるエンティティ、それに属する高レベルのアスペクト、そして対象やアスペクトに対する感情などを特定する自然言語処理の問題です。
– ABSA向けの数多くのデータセットが散在しているため、研究者が特定のABSAサブタスクに最適なデータセットを迅速に特定するのは困難です。
– この研究は、自律型ABSAシステムのトレーニングと評価に使用できるデータベースを提供することを目的としています。
– さらに、ABSAおよびそのサブタスク用の主要なデータセットの概要を提供し、研究者がコーパスを選択する際に考慮すべきいくつかの特徴を強調します。
– 最後に、現在の収集手法の利点と欠点を説明し、将来のデータセット作成に関する提言を行います。
– この調査では、25以上のドメインをカバーする65の公開ABSAデータセットを調査し、英語のデータセット45個とその他の言語のデータセット20個を含みます。

要約(オリジナル)

Aspect-based sentiment analysis (ABSA) is a natural language processing problem that requires analyzing user-generated reviews to determine: a) The target entity being reviewed, b) The high-level aspect to which it belongs, and c) The sentiment expressed toward the targets and the aspects. Numerous yet scattered corpora for ABSA make it difficult for researchers to identify corpora best suited for a specific ABSA subtask quickly. This study aims to present a database of corpora that can be used to train and assess autonomous ABSA systems. Additionally, we provide an overview of the major corpora for ABSA and its subtasks and highlight several features that researchers should consider when selecting a corpus. Finally, we discuss the advantages and disadvantages of current collection approaches and make recommendations for future corpora creation. This survey examines 65 publicly available ABSA datasets covering over 25 domains, including 45 English and 20 other languages datasets.

arxiv情報

著者 Siva Uday Sampreeth Chebolu,Franck Dernoncourt,Nedim Lipka,Thamar Solorio
発行日 2023-04-11 03:18:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.CL パーマリンク