Instruct-DeBERTa: A Hybrid Approach for Aspect-based Sentiment Analysis on Textual Reviews


アスペクトベースの感情分析 (ABSA) は、自然言語処理 (NLP) における重要なタスクであり、テキスト内の特定の側面に関連する感情を抽出することに重点を置き、顧客の意見に対する深い洞察を提供します。
この論文では、語彙ベースのアプローチから機械学習および深層学習技術に至るまで、ABSA 方法論の進化の包括的なレビューを示します。
トランスフォーマーベースのモデル、特にトランスフォーマーからの双方向エンコーダー表現 (BERT) とそのバリアントの最近の進歩を強調します。これらは、ABSA タスクの新しいベンチマークを設定しました。
私たちは、Llama モデルと Mistral モデルの微調整、SetFit フレームワークを使用したハイブリッド モデルの構築、およびアスペクト用語抽出 (ATE) とアスペクト用の最先端 (SOTA) Transformer ベースのモデルの強みを活用した独自のモデルの開発に焦点を当てました。
感情分類 (ASC)。
当社のハイブリッド モデル Instruct – DeBERTa は、アスペクト抽出に SOTA InstructABSA を使用し、アスペクト感情分類に DeBERTa-V3-baseabsa-V1 を使用します。
私たちの実験では、提案されたハイブリッド モデルにより、実験されたすべてのドメインにわたってセンチメント分析の精度と信頼性が大幅に向上することが示されています。
私たちの調査結果によると、ハイブリッド モデル Instruct – DeBERTa は、SemEval レストラン 2014 と SemEval ラップトップ 2014 のデータセットの両方について、ATE と ASC の共同タスクで最もパフォーマンスの高いモデルです。


Aspect-based Sentiment Analysis (ABSA) is a critical task in Natural Language Processing (NLP) that focuses on extracting sentiments related to specific aspects within a text, offering deep insights into customer opinions. Traditional sentiment analysis methods, while useful for determining overall sentiment, often miss the implicit opinions about particular product or service features. This paper presents a comprehensive review of the evolution of ABSA methodologies, from lexicon-based approaches to machine learning and deep learning techniques. We emphasize the recent advancements in Transformer-based models, particularly Bidirectional Encoder Representations from Transformers (BERT) and its variants, which have set new benchmarks in ABSA tasks. We focused on finetuning Llama and Mistral models, building hybrid models using the SetFit framework, and developing our own model by exploiting the strengths of state-of-the-art (SOTA) Transformer-based models for aspect term extraction (ATE) and aspect sentiment classification (ASC). Our hybrid model Instruct – DeBERTa uses SOTA InstructABSA for aspect extraction and DeBERTa-V3-baseabsa-V1 for aspect sentiment classification. We utilize datasets from different domains to evaluate our model’s performance. Our experiments indicate that the proposed hybrid model significantly improves the accuracy and reliability of sentiment analysis across all experimented domains. As per our findings, our hybrid model Instruct – DeBERTa is the best-performing model for the joint task of ATE and ASC for both SemEval restaurant 2014 and SemEval laptop 2014 datasets separately. By addressing the limitations of existing methodologies, our approach provides a robust solution for understanding detailed consumer feedback, thus offering valuable insights for businesses aiming to enhance customer satisfaction and product development.


著者 Dineth Jayakody,A V A Malkith,Koshila Isuranda,Vishal Thenuwara,Nisansa de Silva,Sachintha Rajith Ponnamperuma,G G N Sandamali,K L K Sudheera
発行日 2024-08-23 16:31:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CL パーマリンク