Transfer Learning for Low-Resource Sentiment Analysis

要約

【タイトル】低資源感情分析のための転移学習

【要約】

– 感情分析は、テキストから主観的な情報を特定して抽出するプロセスである。
– 自然言語処理技術の進歩にもかかわらず、感情分析システムの実装と評価には、言語特有のデータが必要であり、社会文化的・言語的な特異性を考慮する必要がある。
– 本論文では、セントラル・クルド語の感情分析のためのデータセットの収集と注釈付けについて説明する。
– このタスクのための古典的な機械学習やニューラルネットワーク技術をいくつか試みる。
– さらに、転移学習の手法を用いて、事前学習されたモデルを活用してデータ拡張を行う。
– 我々は、このタスクの難しさにもかかわらず、データ拡張により、高いF$_1$スコアと精度を実現したことを示した。

要約(オリジナル)

Sentiment analysis is the process of identifying and extracting subjective information from text. Despite the advances to employ cross-lingual approaches in an automatic way, the implementation and evaluation of sentiment analysis systems require language-specific data to consider various sociocultural and linguistic peculiarities. In this paper, the collection and annotation of a dataset are described for sentiment analysis of Central Kurdish. We explore a few classical machine learning and neural network-based techniques for this task. Additionally, we employ an approach in transfer learning to leverage pretrained models for data augmentation. We demonstrate that data augmentation achieves a high F$_1$ score and accuracy despite the difficulty of the task.

arxiv情報

著者 Razhan Hameed,Sina Ahmadi,Fatemeh Daneshfar
発行日 2023-04-10 16:44:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL パーマリンク