信用スコアリングは、銀行ローンに対する借り手のデフォルト確率 (PD) を評価する体系的なアプローチです。
これらのデータセットの不均衡率 (IR) が高いことを考慮して、IR 依存の非対称調整因子埋め込みシグモイド活性化関数 (ASIG) を組み込むことにより、革新的でありながら簡単な最適化された活性化関数を導入します。
ASIG の埋め込みにより、分散されたデータセットの不均衡の性質に応じて、シグモイド関数の感度マージンが自動調整可能になり、それにより、分類器の学習中に少数クラス (正のサンプル) が過小評価されることを防ぐ非対称特性が活性化関数に与えられます。
実験結果は、下流のクレジット スコアリング タスクにおいて、ASIG 埋め込み分類器が広範囲の IR にわたるデータセットで従来の分類器よりも優れたパフォーマンスを発揮することを示しています。
このアルゴリズムは、IR が超高値の場合でも堅牢性と安定性を示します。
Credit scoring is a systematic approach to evaluate a borrower’s probability of default (PD) on a bank loan. The data associated with such scenarios are characteristically imbalanced, complicating binary classification owing to the often-underestimated cost of misclassification during the classifier’s learning process. Considering the high imbalance ratio (IR) of these datasets, we introduce an innovative yet straightforward optimized activation function by incorporating an IR-dependent asymmetric adjusted factor embedded Sigmoid activation function (ASIG). The embedding of ASIG makes the sensitive margin of the Sigmoid function auto-adjustable, depending on the imbalance nature of the datasets distributed, thereby giving the activation function an asymmetric characteristic that prevents the underrepresentation of the minority class (positive samples) during the classifier’s learning process. The experimental results show that the ASIG-embedded-classifier outperforms traditional classifiers on datasets across wide-ranging IRs in the downstream credit-scoring task. The algorithm also shows robustness and stability, even when the IR is ultra-high. Therefore, the algorithm provides a competitive alternative in the financial industry, especially in credit scoring, possessing the ability to effectively process highly imbalanced distribution data.
著者 | Xia Li,Hanghang Zheng,Kunpeng Tao,Mao Mao |
発行日 | 2025-01-21 16:54:39+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google