GPT-InvestAR: Enhancing Stock Investment Strategies through Annual Report Analysis with Large Language Models

要約

上場企業の年次報告書には、企業の株価への潜在的な影響を評価するのに役立つ財務健全性に関する重要な情報が含まれています。
これらのレポートは本質的に包括的であり、100 ページに及ぶ場合もあります。
これらのレポートを分析するのは、存在する企業全体はもちろんのこと、単一の企業であっても困難です。
長年にわたり、金融専門家はこれらの文書から貴重な情報を比較的迅速に抽出することに熟練してきました。
ただし、これには長年の練習と経験が必要です。
このペーパーは、大規模言語モデル (LLM) の機能を活用して、すべての企業の年次報告書を評価するプロセスを簡素化することを目的としています。
LLM によって生成された洞察は、Quant スタイルのデータセットにまとめられ、過去の株価データによって強化されます。
次に、機械学習モデルは、LLM 出力を特徴として使用してトレーニングされます。
ウォークフォワード テストの結果は、S&P500 のリターンを上回るパフォーマンスが期待できることを示しています。
この文書は、この方向における将来の作業のための枠組みを提供することを目的としています。
これを容易にするために、コードはオープンソースとしてリリースされました。

要約(オリジナル)

Annual Reports of publicly listed companies contain vital information about their financial health which can help assess the potential impact on Stock price of the firm. These reports are comprehensive in nature, going up to, and sometimes exceeding, 100 pages. Analysing these reports is cumbersome even for a single firm, let alone the whole universe of firms that exist. Over the years, financial experts have become proficient in extracting valuable information from these documents relatively quickly. However, this requires years of practice and experience. This paper aims to simplify the process of assessing Annual Reports of all the firms by leveraging the capabilities of Large Language Models (LLMs). The insights generated by the LLM are compiled in a Quant styled dataset and augmented by historical stock price data. A Machine Learning model is then trained with LLM outputs as features. The walkforward test results show promising outperformance wrt S&P500 returns. This paper intends to provide a framework for future work in this direction. To facilitate this, the code has been released as open source.

arxiv情報

著者 Udit Gupta
発行日 2023-09-06 17:18:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.LG, q-fin.ST パーマリンク