A machine learning workflow to address credit default prediction


最近の金融テクノロジー (FinTech) への関心の高まりにより、クレジット デフォルト予測 (CDP) などのアプリケーションが産業界および学術界で大きな注目を集めています。
この点で、CDP は個人や企業の信用力を評価する上で重要な役割を果たし、貸し手がローンの承認とリスク管理に関して十分な情報に基づいた意思決定を行えるようにします。
このペーパーでは、CDP を改善するためのワークフロー ベースのアプローチを提案します。CDP とは、借り手が信用債務を履行できない確率を評価するタスクを指します。
ワークフローは複数のステップで構成されており、各ステップは機械学習パイプラインで特徴付けられているさまざまな技術の長所を活用して、CDP タスクを最適に解決するように設計されています。
当社では、証拠の重みエンコーディングを使用したデータの前処理から始まる包括的かつ体系的なアプローチを採用しています。この手法は、外れ値の除去、欠損値の処理、さまざまなデータ型を扱うモデルのデータの均一化によって、単発のデータ スケーリングを保証します。
次に、いくつかの学習モデル ファミリをトレーニングし、より堅牢なモデルを構築するためのアンサンブル手法と、予測精度と財務的側面の両方を考慮する多目的遺伝的アルゴリズムによるハイパーパラメーターの最適化を導入します。
私たちの研究は、より正確で信頼性の高い信用リスク評価に移行するためのツールを提供し、貸し手と借り手の両方に利益をもたらすツールを提供することで FinTech 業界に貢献することを目的としています。


Due to the recent increase in interest in Financial Technology (FinTech), applications like credit default prediction (CDP) are gaining significant industrial and academic attention. In this regard, CDP plays a crucial role in assessing the creditworthiness of individuals and businesses, enabling lenders to make informed decisions regarding loan approvals and risk management. In this paper, we propose a workflow-based approach to improve CDP, which refers to the task of assessing the probability that a borrower will default on his or her credit obligations. The workflow consists of multiple steps, each designed to leverage the strengths of different techniques featured in machine learning pipelines and, thus best solve the CDP task. We employ a comprehensive and systematic approach starting with data preprocessing using Weight of Evidence encoding, a technique that ensures in a single-shot data scaling by removing outliers, handling missing values, and making data uniform for models working with different data types. Next, we train several families of learning models, introducing ensemble techniques to build more robust models and hyperparameter optimization via multi-objective genetic algorithms to consider both predictive accuracy and financial aspects. Our research aims at contributing to the FinTech industry in providing a tool to move toward more accurate and reliable credit risk assessment, benefiting both lenders and borrowers.


著者 Rambod Rahmani,Marco Parola,Mario G. C. A. Cimino
発行日 2024-03-06 15:30:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CE, cs.LG, q-fin.RM パーマリンク