Adversarial Capsule Networks for Romanian Satire Detection and Sentiment Analysis

要約

風刺検出と感情分析は、テキストから風刺的なトーンを特定し、ターゲットとの関係で感情を抽出することを研究する自然言語処理 (NLP) タスクで、集中的に研究されています。
研究リソースが少ない言語では、データセット サイズの制限を克服するために、文字レベルの敵対的プロセスに基づいて人工的な例を生成するという代替案があります。
このようなサンプルは正則化手法として機能することが証明されており、モデルの堅牢性が向上します。
この研究では、よく知られている NLP モデル (畳み込みニューラル ネットワーク、長短期記憶 (LSTM)、双方向 LSTM、ゲート型リカレント ユニット (GRU)、双方向 GRU) を敵対的トレーニングとカプセル ネットワークで改善します。
微調整されたモデルは、ルーマニア語での風刺検出および感情分析タスクに使用されます。
提案されたフレームワークは、2 つのタスクに関して既存の手法を上回り、最大 99.08% の精度を達成しました。これにより、カプセル レイヤーと NLP アプローチの敵対的トレーニングによって追加された改善が確認されました。

要約(オリジナル)

Satire detection and sentiment analysis are intensively explored natural language processing (NLP) tasks that study the identification of the satirical tone from texts and extracting sentiments in relationship with their targets. In languages with fewer research resources, an alternative is to produce artificial examples based on character-level adversarial processes to overcome dataset size limitations. Such samples are proven to act as a regularization method, thus improving the robustness of models. In this work, we improve the well-known NLP models (i.e., Convolutional Neural Networks, Long Short-Term Memory (LSTM), Bidirectional LSTM, Gated Recurrent Units (GRUs), and Bidirectional GRUs) with adversarial training and capsule networks. The fine-tuned models are used for satire detection and sentiment analysis tasks in the Romanian language. The proposed framework outperforms the existing methods for the two tasks, achieving up to 99.08% accuracy, thus confirming the improvements added by the capsule layers and the adversarial training in NLP approaches.

arxiv情報

著者 Sebastian-Vasile Echim,Răzvan-Alexandru Smădu,Andrei-Marius Avram,Dumitru-Clementin Cercel,Florin Pop
発行日 2023-06-13 15:23:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク