Using multimodal learning and deep generative models for corporate bankruptcy prediction

要約

財務書類のテキスト データ (Form 10-K の Management’s Discussion & Analysis (MDA) セクションなど) は、破産モデルの予測精度を向上させるために使用されています。
しかし、実際には、すべての上場企業の MDA セクションを取得することはできません。
MDA が存在しない主な理由は 2 つあります。(i) すべての企業に MDA の提出が義務付けられているわけではないこと、および (ii) MDA セクションをクロールおよびスクラップするときに技術的な問題が発生することです。
この研究では、一部の企業で MDA テキストを入手できないという問題を解決するために、破産予測モデルにマルチモーダル学習の概念を、私たちの知る限り初めて導入しました。
条件付きマルチモーダル識別 (CMMD) モデルを使用して、会計、市場、およびテキスト モダリティからの情報を埋め込むマルチモーダル表現を学習します。
CMMD モデルには、モデル トレーニング用のすべてのデータ モダリティを含むサンプルが必要です。
テスト時に、CMMD モデルは会計および市場モダリティにアクセスしてマルチモーダル表現を生成するだけで済みます。これらの表現は破産予測を行うためにさらに使用されます。
このため、テキストデータとは異なり、会計データや市場データはすべての企業で利用できるため、テキストデータを使用した倒産予測モデルの利用が現実的かつ可能になります。
この研究の実証結果は、私たちが提案する方法論の分類パフォーマンスが、多数の従来の分類器モデルの分類パフォーマンスと比較して優れていることを示しています。
また、私たちが提案した方法論は、テキストデータを使用した以前の倒産モデルの限界(少数の企業しか予測できない)を解決することも示します。

要約(オリジナル)

Textual data from financial filings, e.g., the Management’s Discussion \& Analysis (MDA) section in Form 10-K, has been used to improve the prediction accuracy of bankruptcy models. In practice, however, we cannot obtain the MDA section for all public companies. The two main reasons for the lack of MDA are: (i) not all companies are obliged to submit the MDA and (ii) technical problems arise when crawling and scrapping the MDA section. This research introduces for the first time, to the best of our knowledge, the concept of multimodal learning in bankruptcy prediction models to solve the problem that for some companies we are unable to obtain the MDA text. We use the Conditional Multimodal Discriminative (CMMD) model to learn multimodal representations that embed information from accounting, market, and textual modalities. The CMMD model needs a sample with all data modalities for model training. At test time, the CMMD model only needs access to accounting and market modalities to generate multimodal representations, which are further used to make bankruptcy predictions. This fact makes the use of bankruptcy prediction models using textual data realistic and possible, since accounting and market data are available for all companies unlike textual data. The empirical results in this research show that the classification performance of our proposed methodology is superior compared to that of a large number of traditional classifier models. We also show that our proposed methodology solves the limitation of previous bankruptcy models using textual data, as they can only make predictions for a small proportion of companies.

arxiv情報

著者 Rogelio A. Mancisidor,Kjersti Aas
発行日 2023-11-06 16:34:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-fin.RM, stat.ML パーマリンク