要約
情報の可用性と計算機能の最近の進歩により、年次報告書の分析が変化し、従来の財務指標とテキストデータからの洞察を統合しました。
この豊富なテキストデータから貴重な洞察を抽出するには、トピックモデリングなどの自動化されたレビュープロセスが重要です。
この研究では、S&P 500企業(2016-2022)からの10-Kファイリングの項目7と項目7Aを分析するために、コンテキストの埋め込みに依存する最先端のトピックモデルであるBertopicの有効性を検証します。
さらに、財務的なコンテキストでのクラスタリングとセマンティック検索のために最適化されたFintuned Sente-TransformerモデルであるFintextSimを紹介します。
最も広く使用されている文化変換者であるAll-Minilm-L6-V2と比較して、FintextSimは視界内の類似性を81%増加させ、トピック間類似性を100%減らし、組織の明確さを大幅に向上させます。
FintextSimとAll-Minilm-L6-V2の両方からの埋め込みを使用して、Bertopicのパフォーマンスを評価します。
私たちの調査結果は、Fintextsimの埋め込みと組み合わせると、Bertopicが明確で明確な経済的トピッククラスターのみを形成することを明らかにしています。
fintextsimがなければ、bertopicは誤分類と重複するトピックとの闘いをします。
したがって、fintextsimは、金融テキスト分析を進めるために極めて重要です。
Fintextsimの財務ドメインに合わせて調整されたFintextsimの強化されたコンテキスト埋め込みは、将来の研究と財務情報の質を高めます。
この財務情報の質の向上により、利害関係者は競争上の優位性を獲得し、リソースの割り当てと意思決定プロセスを合理化できます。
さらに、改善された洞察は、ビジネス評価と株価予測モデルを活用する可能性があります。
要約(オリジナル)
Recent advancements in information availability and computational capabilities have transformed the analysis of annual reports, integrating traditional financial metrics with insights from textual data. To extract valuable insights from this wealth of textual data, automated review processes, such as topic modeling, are crucial. This study examines the effectiveness of BERTopic, a state-of-the-art topic model relying on contextual embeddings, for analyzing Item 7 and Item 7A of 10-K filings from S&P 500 companies (2016-2022). Moreover, we introduce FinTextSim, a finetuned sentence-transformer model optimized for clustering and semantic search in financial contexts. Compared to all-MiniLM-L6-v2, the most widely used sentence-transformer, FinTextSim increases intratopic similarity by 81% and reduces intertopic similarity by 100%, significantly enhancing organizational clarity. We assess BERTopic’s performance using embeddings from both FinTextSim and all-MiniLM-L6-v2. Our findings reveal that BERTopic only forms clear and distinct economic topic clusters when paired with FinTextSim’s embeddings. Without FinTextSim, BERTopic struggles with misclassification and overlapping topics. Thus, FinTextSim is pivotal for advancing financial text analysis. FinTextSim’s enhanced contextual embeddings, tailored for the financial domain, elevate the quality of future research and financial information. This improved quality of financial information will enable stakeholders to gain a competitive advantage, streamlining resource allocation and decision-making processes. Moreover, the improved insights have the potential to leverage business valuation and stock price prediction models.
arxiv情報
著者 | Simon Jehnen,Joaquín Ordieres-Meré,Javier Villalba-Díez |
発行日 | 2025-04-22 08:06:37+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google