Stock Market Sentiment Classification and Backtesting via Fine-tuned BERT

要約

ビッグデータとコンピューティングデバイスの急速な発展に伴い、リアルタイムの情報取得に基づく低遅延の自動取引プラットフォームが株式取引市場の主要な構成要素となり、定量的取引というテーマが広く注目を集めています。
そして、それほど効率的ではない取引市場では、人間の感情や期待が常に市場のトレンドや取引の意思決定を支配します。
したがって、この論文は、East Money を例として感情の理論から開始し、対応する株価バーからユーザーのコメント タイトル データをクローリングし、データ クリーニングを実行します。
続いて、自然言語処理モデル BERT が構築され、既存の注釈付きデータ セットを使用して BERT モデルが微調整されました。
実験結果は、微調整されたモデルでは、元のモデルやベースライン モデルと比較して、パフォーマンスの向上の度合いが異なることがわかりました。
次に、上記のモデルに基づいて、クロールされたユーザーのコメントデータに感情極性のラベルが付けられ、取得されたラベル情報が Alpha191 モデルと結合されて回帰に参加し、有意な回帰結果が得られます。
その後、回帰モデルを使用して今後 5 日間の平均価格の変化を予測し、自動取引をガイドするシグナルとして使用します。
実験結果は、感情的要因を組み込むことにより、取引期間中のベースラインと比較して返品率が 73.8% 増加し、元の alpha191 モデルと比較して 32.41% 増加したことを示しています。
最後に、定量的取引に感情的要素を組み込むことの利点と欠点について説明し、将来のさらなる研究の可能性のある方向性を示します。

要約(オリジナル)

With the rapid development of big data and computing devices, low-latency automatic trading platforms based on real-time information acquisition have become the main components of the stock trading market, so the topic of quantitative trading has received widespread attention. And for non-strongly efficient trading markets, human emotions and expectations always dominate market trends and trading decisions. Therefore, this paper starts from the theory of emotion, taking East Money as an example, crawling user comment titles data from its corresponding stock bar and performing data cleaning. Subsequently, a natural language processing model BERT was constructed, and the BERT model was fine-tuned using existing annotated data sets. The experimental results show that the fine-tuned model has different degrees of performance improvement compared to the original model and the baseline model. Subsequently, based on the above model, the user comment data crawled is labeled with emotional polarity, and the obtained label information is combined with the Alpha191 model to participate in regression, and significant regression results are obtained. Subsequently, the regression model is used to predict the average price change for the next five days, and use it as a signal to guide automatic trading. The experimental results show that the incorporation of emotional factors increased the return rate by 73.8\% compared to the baseline during the trading period, and by 32.41\% compared to the original alpha191 model. Finally, we discuss the advantages and disadvantages of incorporating emotional factors into quantitative trading, and give possible directions for further research in the future.

arxiv情報

著者 Jiashu Lou
発行日 2023-09-21 11:26:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.LG, q-fin.CP パーマリンク