要約
【タイトル】低資源感情分析のための転移学習
【要約】
– 感情分析は、テキストから主観的な情報を特定して抽出するプロセスである。
– 自然言語処理技術の進歩にもかかわらず、感情分析システムの実装と評価には、言語特有のデータが必要であり、社会文化的・言語的な特異性を考慮する必要がある。
– 本論文では、セントラル・クルド語の感情分析のためのデータセットの収集と注釈付けについて説明する。
– このタスクのための古典的な機械学習やニューラルネットワーク技術をいくつか試みる。
– さらに、転移学習の手法を用いて、事前学習されたモデルを活用してデータ拡張を行う。
– 我々は、このタスクの難しさにもかかわらず、データ拡張により、高いF$_1$スコアと精度を実現したことを示した。
要約(オリジナル)
Sentiment analysis is the process of identifying and extracting subjective information from text. Despite the advances to employ cross-lingual approaches in an automatic way, the implementation and evaluation of sentiment analysis systems require language-specific data to consider various sociocultural and linguistic peculiarities. In this paper, the collection and annotation of a dataset are described for sentiment analysis of Central Kurdish. We explore a few classical machine learning and neural network-based techniques for this task. Additionally, we employ an approach in transfer learning to leverage pretrained models for data augmentation. We demonstrate that data augmentation achieves a high F$_1$ score and accuracy despite the difficulty of the task.
arxiv情報
著者 | Razhan Hameed,Sina Ahmadi,Fatemeh Daneshfar |
発行日 | 2023-04-10 16:44:44+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI