Indo LEGO-ABSA: A Multitask Generative Aspect Based Sentiment Analysis for Indonesian Language

要約

アスペクトベースの感情分析は、自然言語処理における手法の1つで、エンティティの特定のアスペクトに関連する感情を特定し、理解することを目的としている。アスペクトとは、特定のエンティティの側面や属性を表す単語やフレーズのことである。これまでの研究では、アスペクトベースの感情分析を行うために、事前に訓練された生成言語モデルを利用してきた。LEGO-ABSAは、特に英語において、アスペクトに基づく感情分析に生成的な事前学習済み言語モデルを採用することに成功したフレームワークの一つである。LEGO-ABSAは、モデルの性能を向上させるために、マルチタスク学習とプロンプトのアプローチを使用している。しかし、このアプローチをインドネシア語の文脈に適用することは行われていない。そこで本研究では、生成的に事前学習された言語モデルを用いて、インドネシア語のアスペクトベースの感情分析にマルチタスク学習とプロンプトのアプローチを実装することを目的とする。本研究では、生成的な事前学習済み言語モデルを利用し、マルチタスク学習とプロンプティングで学習させたアスペクトベースの感情分析モデルであるIndo LEGO-ABSAモデルを開発する。Indo LEGO-ABSAはインドネシア語のホテルドメインデータセットを用いて学習される。その結果、アスペクト・センチメント・トリプレット抽出タスクのf1スコアは79.55%、統合アスペクト・ベース・センチメント分析タスクのf1スコアは86.09%、アスペクト・オピニオン・ペア抽出タスクのf1スコアは79.85%、アスペクト・ターム抽出タスクのf1スコアは87.45%、オピニオン・ターム抽出タスクのf1スコアは88.09%であった。Indo LEGO-ABSAは、T5モデル、特にmT5を採用したLEGO-ABSAフレームワークを採用し、アスペクトベース感情分析内のすべてのタスクの学習にマルチタスク学習を適用している。

要約(オリジナル)

Aspect-based sentiment analysis is a method in natural language processing aimed at identifying and understanding sentiments related to specific aspects of an entity. Aspects are words or phrases that represent an aspect or attribute of a particular entity. Previous research has utilized generative pre-trained language models to perform aspect-based sentiment analysis. LEGO-ABSA is one framework that has successfully employed generative pre-trained language models in aspect-based sentiment analysis, particularly in English. LEGO-ABSA uses a multitask learning and prompting approach to enhance model performance. However, the application of this approach has not been done in the context of Bahasa Indonesia. Therefore, this research aims to implement the multitask learning and prompting approach in aspect-based sentiment analysis for Bahasa Indonesia using generative pre-trained language models. In this study, the Indo LEGO-ABSA model is developed, which is an aspect-based sentiment analysis model utilizing generative pre-trained language models and trained with multitask learning and prompting. Indo LEGO-ABSA is trained with a hotel domain dataset in the Indonesian language. The obtained results include an f1-score of 79.55% for the Aspect Sentiment Triplet Extraction task, 86.09% for Unified Aspect-based Sentiment Analysis, 79.85% for Aspect Opinion Pair Extraction, 87.45% for Aspect Term Extraction, and 88.09% for Opinion Term Extraction. Indo LEGO-ABSA adopts the LEGO-ABSA framework that employs the T5 model, specifically mT5, by applying multitask learning to train all tasks within aspect-based sentiment analysis.

arxiv情報

著者 Randy Zakya Suchrady,Ayu Purwarianti
発行日 2023-11-03 07:28:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CL, I.2.7 パーマリンク