要約
金融領域におけるエンティティレベルのきめ細かいセンチメント分析はセンチメント分析の重要なサブタスクですが、現在多くの課題に直面しています。
主な課題は、金融テキストセンチメント分析用に特別に設計された高品質で大規模な注釈付きコーパスが不足していることにあり、その結果、効果的なテキスト処理技術の開発に必要なデータの利用可能性が制限されます。
大規模言語モデル (LLM) の最近の進歩により、主に言語パターン マッチングを中心とした自然言語処理タスクで目覚ましいパフォーマンスが得られました。
この論文では、企業の早期警告のために、新規かつ広範な中国のきめ細かい金融センチメント分析データセットである FinChina SA を提案します。
私たちは、データセットを使用して、既知の既存のオープンソース LLM を徹底的に評価し、実験します。
私たちは、私たちのデータセットが、将来の研究の焦点となるべき現実世界の金融センチメント分析タスクの探索を進めるための貴重なリソースとして役立つと確信しています。
実験結果を再現するためのデータセットとすべてのコードがリリースされます。
要約(オリジナル)
Entity-level fine-grained sentiment analysis in the financial domain is a crucial subtask of sentiment analysis and currently faces numerous challenges. The primary challenge stems from the lack of high-quality and large-scale annotated corpora specifically designed for financial text sentiment analysis, which in turn limits the availability of data necessary for developing effective text processing techniques. Recent advancements in large language models (LLMs) have yielded remarkable performance in natural language processing tasks, primarily centered around language pattern matching. In this paper, we propose a novel and extensive Chinese fine-grained financial sentiment analysis dataset, FinChina SA, for enterprise early warning. We thoroughly evaluate and experiment with well-known existing open-source LLMs using our dataset. We firmly believe that our dataset will serve as a valuable resource to advance the exploration of real-world financial sentiment analysis tasks, which should be the focus of future research. Our dataset and all code to replicate the experimental results will be released.
arxiv情報
著者 | Yinyu Lan,Yanru Wu,Wang Xu,Weiqiang Feng,Youhao Zhang |
発行日 | 2023-07-21 08:57:38+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google