MEMD-ABSA: A Multi-Element Multi-Domain Dataset for Aspect-Based Sentiment Analysis

要約

アスペクトベースのセンチメント分析は、オピニオンマイニングの分野における長年の研究関心であり、近年、研究者は単純な ABSA サブタスクからエンドツーエンドの複数要素の ABSA タスクに徐々に焦点を移しています。
ただし、現在研究で使用されているデータセットは、特定のタスクの個々の要素に限定されており、通常はドメイン内設定に焦点を当て、暗黙的な側面や意見を無視しており、データ規模は小さいです。
これらの問題に対処するために、我々は、5 つのドメインにわたる 4 つの要素をカバーする大規模な多要素マルチドメイン データセット (MEMD) を提案します。これには、ABSA 研究の明示的および暗黙的な側面と意見が注釈として付けられた約 20,000 のレビュー文と 30,000 のクアドルプルが含まれます。
一方、私たちはオープンドメイン設定の下で複数の ABSA サブタスクの生成ベースラインと非生成ベースラインを評価しました。その結果は、オープンドメイン ABSA と暗黙的な側面や意見のマイニングが依然として対処すべき継続的な課題であることを示しています。
データセットは \url{https://github.com/NUSTM/MEMD-ABSA} で公開されています。

要約(オリジナル)

Aspect-based sentiment analysis is a long-standing research interest in the field of opinion mining, and in recent years, researchers have gradually shifted their focus from simple ABSA subtasks to end-to-end multi-element ABSA tasks. However, the datasets currently used in the research are limited to individual elements of specific tasks, usually focusing on in-domain settings, ignoring implicit aspects and opinions, and with a small data scale. To address these issues, we propose a large-scale Multi-Element Multi-Domain dataset (MEMD) that covers the four elements across five domains, including nearly 20,000 review sentences and 30,000 quadruples annotated with explicit and implicit aspects and opinions for ABSA research. Meanwhile, we evaluate generative and non-generative baselines on multiple ABSA subtasks under the open domain setting, and the results show that open domain ABSA as well as mining implicit aspects and opinions remain ongoing challenges to be addressed. The datasets are publicly released at \url{https://github.com/NUSTM/MEMD-ABSA}.

arxiv情報

著者 Hongjie Cai,Nan Song,Zengzhi Wang,Qiming Xie,Qiankun Zhao,Ke Li,Siwei Wu,Shijie Liu,Jianfei Yu,Rui Xia
発行日 2023-06-29 14:03:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク