Arabic aspect sentiment polarity classification using BERT

要約

側面に基づく感情分析 (ABSA) は、特定のターゲットに関連する特定の側面に関する意見の極性を定義するテキスト分析方法論です。
ABSA に関する研究の大部分は英語で行われており、アラビア語で利用できる研究はわずかです。
これまでのほとんどのアラビア語の研究は、主にコンテキストに依存しない単語の埋め込み (word2vec など) に依存するディープ ラーニング モデルに依存しており、各単語はそのコンテキストに依存しない固定表現を持っています。
この記事では、BERT などの事前トレーニング済み言語モデルからのコンテキスト埋め込みのモデリング機能と、アラビア語の側面の感情極性分類タスクでの文ペア入力の利用について説明します。
特に、このタスクを処理するために、単純だが効果的な BERT ベースのニューラル ベースラインを開発します。
3 つの異なるアラビア語データセットでの実験結果によると、シンプルな線形分類レイヤーを備えた BERT アーキテクチャは、最先端の作品を凌駕しています。
アラビア語のホテル レビュー データセットで 89.51%、人間の注釈付き書籍レビュー データセットで 73%、アラビア語ニュース データセットで 85.73% の精度を達成しています。

要約(オリジナル)

Aspect-based sentiment analysis(ABSA) is a textual analysis methodology that defines the polarity of opinions on certain aspects related to specific targets. The majority of research on ABSA is in English, with a small amount of work available in Arabic. Most previous Arabic research has relied on deep learning models that depend primarily on context-independent word embeddings (e.g.word2vec), where each word has a fixed representation independent of its context. This article explores the modeling capabilities of contextual embeddings from pre-trained language models, such as BERT, and making use of sentence pair input on Arabic aspect sentiment polarity classification task. In particular, we develop a simple but effective BERT-based neural baseline to handle this task. Our BERT architecture with a simple linear classification layer surpassed the state-of-the-art works, according to the experimental results on three different Arabic datasets. Achieving an accuracy of 89.51% on the Arabic hotel reviews dataset, 73% on the Human annotated book reviews dataset, and 85.73% on the Arabic news dataset.

arxiv情報

著者 Mohammed M. Abdelgwad,Taysir Hassan A Soliman,Ahmed I. Taloba
発行日 2023-03-10 18:59:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク