Multi-View Attention Syntactic Enhanced Graph Convolutional Network for Aspect-based Sentiment Analysis

要約

アスペクトベースのセンチメント分析(ABSA)は、文内のアスペクトワードの感情極性を予測することを目的としたタスクです。
最近、グラフニューラルネットワーク(GNNS)を組み込み、構文依存関係解析から派生した依存性ツリーに追加の構文構造情報をキャプチャしていることは、ABSAを強化するための効果的なパラダイムであることが証明されています。
より多くの種類の情報を融合させることでモデル能力を向上させるGNNSにもかかわらず、ほとんどの作業は、依存関係ツリーの単一のトポロジビューを利用するか、モデルのパフォーマンスを制限する区別なしで情報の異なる視点を単に混同するだけです。
これらの課題に対処するために、このホワイトペーパーでは、注意メカニズムを使用してビューの異なる構文情報を比較検討する新しいマルチビュー注意構文強化グラフ畳み込みネットワーク(MASGCN)を提案します。
具体的には、最初に依存関係ツリーから距離マスク行列を構築して、GNNの複数のサブグラフビューを取得します。
さまざまなビューから機能を集約するために、マルチビューの注意メカニズムを提案して、ビューの注意の重みを計算します。
さらに、より多くの構文情報を組み込むために、依存関係の型情報マトリックスを隣接するマトリックスに融合し、構造エントロピー損失を提示して、依存型の隣接マトリックスを学習します。
4つのベンチマークデータセットでの包括的な実験は、モデルが最新の方法よりも優れていることを示しています。
コードとデータセットはhttps://github.com/selgroup/masgcnで入手できます。

要約(オリジナル)

Aspect-based Sentiment Analysis (ABSA) is the task aimed at predicting the sentiment polarity of aspect words within sentences. Recently, incorporating graph neural networks (GNNs) to capture additional syntactic structure information in the dependency tree derived from syntactic dependency parsing has been proven to be an effective paradigm for boosting ABSA. Despite GNNs enhancing model capability by fusing more types of information, most works only utilize a single topology view of the dependency tree or simply conflate different perspectives of information without distinction, which limits the model performance. To address these challenges, in this paper, we propose a new multi-view attention syntactic enhanced graph convolutional network (MASGCN) that weighs different syntactic information of views using attention mechanisms. Specifically, we first construct distance mask matrices from the dependency tree to obtain multiple subgraph views for GNNs. To aggregate features from different views, we propose a multi-view attention mechanism to calculate the attention weights of views. Furthermore, to incorporate more syntactic information, we fuse the dependency type information matrix into the adjacency matrices and present a structural entropy loss to learn the dependency type adjacency matrix. Comprehensive experiments on four benchmark datasets demonstrate that our model outperforms state-of-the-art methods. The codes and datasets are available at https://github.com/SELGroup/MASGCN.

arxiv情報

著者 Xiang Huang,Hao Peng,Shuo Sun,Zhifeng Hao,Hui Lin,Shuhai Wang
発行日 2025-01-27 11:26:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク