要約
健全で安定した経済を維持するためには、産業間のトレンドを分析することが重要です。これまでの研究では、主に公的統計の分析が行われており、より正確ではあるが、必ずしもリアルタイムではない。本論文では、株式市場データを用いた産業動向の分析手法を提案する。この作業の難しさは、生データが比較的ノイズが多く、統計解析の精度に影響することである。また、産業分析のためのテキストデータは、言語モデルによってよりよく理解される必要がある。このため、明示的分析と暗黙的分析の2つの観点から、産業動向分析の手法を紹介する。明示的分析では、ノイズの影響を軽減するために、階層的データ(業界と上場企業)分析手法を導入しています。暗黙的分析では、さらにGPT-2に時事背景を入力として業界動向を分析させる事前学習を行い、事前学習コーパスで学習した知識を最大限に活用する。提案手法に基づき実験を行い、良好な業界動向分析結果を得ることができた。
要約(オリジナル)
Analyzing trends across industries is critical to maintaining a healthy and stable economy. Previous research has mainly analyzed official statistics, which are more accurate but not necessarily real-time. In this paper, we propose a method for analyzing industry trends using stock market data. The difficulty of this task is that the raw data is relatively noisy, which affects the accuracy of statistical analysis. In addition, textual data for industry analysis needs to be better understood through language models. For this reason, we introduce the method of industry trend analysis from two perspectives of explicit analysis and implicit analysis. For the explicit analysis, we introduce a hierarchical data (industry and listed company) analysis method to reduce the impact of noise. For implicit analysis, we further pre-train GPT-2 to analyze industry trends with current affairs background as input, making full use of the knowledge learned in the pre-training corpus. We conduct experiments based on the proposed method and achieve good industry trend analysis results.
arxiv情報
著者 | Hongyin Zhu |
発行日 | 2023-03-05 16:17:56+00:00 |
arxivサイト | arxiv_id(pdf) |