Chinese Financial Text Emotion Mining: GCGTS — A Character Relationship-based Approach for Simultaneous Aspect-Opinion Pair Extraction

要約

中国語の金融テキストからのアスペクト-オピニオンペア抽出(AOPE)は、きめ細かいテキスト感情分析に特化したタスクである。主な目的は、多様な金融テキストからアスペクト用語とオピニオン用語を同時に抽出することである。これまでの研究では、この抽出プロセスを容易にするために、主にグリッドベースのモデル内でグリッドアノテーションスキームを開発することに焦点が当てられてきた。しかし、これらの方法は文字レベル(トークンレベル)の特徴エンコーディングに依存することが多く、単語内の漢字間の論理的関係を見落とす可能性がある。この限界に対処するために、我々はグラフベースの文字レベルグリッドタギングスキーム(GCGTS)と呼ばれる新しい方法を提案する。GCGTS法は、グラフ畳み込みネットワーク(GCN)を用いて構文構造を明示的に取り込み、同じ構文意味単位(中国語の単語レベル)内の文字の符号化を統一する。さらに、グリッドモデルに画像畳み込み構造を導入し、評価単位内の文字間の局所的な関係をよりよく捉える。この革新的な構造により、事前に訓練された言語モデルへの過度の依存を減らし、構造と局所的な関係のモデリングを強調することで、中国語の金融テキストに対するモデルの性能を向上させる。Synchronous Double-channel Recurrent Network (SDRN)やGrid Tagging Scheme (GTS)などの先進的なモデルとの比較実験を通じて、提案するGCGTSモデルは性能の大幅な向上を実証した。

要約(オリジナル)

Aspect-Opinion Pair Extraction (AOPE) from Chinese financial texts is a specialized task in fine-grained text sentiment analysis. The main objective is to extract aspect terms and opinion terms simultaneously from a diverse range of financial texts. Previous studies have mainly focused on developing grid annotation schemes within grid-based models to facilitate this extraction process. However, these methods often rely on character-level (token-level) feature encoding, which may overlook the logical relationships between Chinese characters within words. To address this limitation, we propose a novel method called Graph-based Character-level Grid Tagging Scheme (GCGTS). The GCGTS method explicitly incorporates syntactic structure using Graph Convolutional Networks (GCN) and unifies the encoding of characters within the same syntactic semantic unit (Chinese word level). Additionally, we introduce an image convolutional structure into the grid model to better capture the local relationships between characters within evaluation units. This innovative structure reduces the excessive reliance on pre-trained language models and emphasizes the modeling of structure and local relationships, thereby improving the performance of the model on Chinese financial texts. Through comparative experiments with advanced models such as Synchronous Double-channel Recurrent Network (SDRN) and Grid Tagging Scheme (GTS), the proposed GCGTS model demonstrates significant improvements in performance.

arxiv情報

著者 Qi Chen,Dexi Liu
発行日 2023-08-04 02:20:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL パーマリンク