Inclusive FinTech Lending via Contrastive Learning and Domain Adaptation




– FinTech貸付(例:マイクロ貸し)は、金融包摂を促進する上で重要な役割を果たしている。
– FinTech貸付は、処理時間とコストを削減し、ユーザー体験を向上させ、従来の貸付業者から信用を得られなかった人々が貸付を受けることが可能になった。
– しかしながら、貸付スクリーニング中にバイアスのかかったアルゴリズム的な意思決定についての懸念がある。
– 信用品質を評価するために使用される機械学習アルゴリズムは、訓練データの表現バイアスに影響を受けることがある。
– 我々は、実世界のFinTech貸付プラットフォームでの貸付スクリーニングにおける表現バイアスの問題について調査する。
– 我々は、自己教師あり対照学習とドメイン適応を用いた新しいTransformerベースのシーケンシャル貸付スクリーニングモデルを提案する。
– 我々は、コントラスティブ学習を使用して未承認(未ラベル化)の貸付申請に対して特徴抽出器をトレーニングし、ドメイン適応を使用してラベル予測器のパフォーマンスを一般化する。
– 実験により、我々のモデルが資金調達の決定の包括性を大幅に促進し、貸付スクリーニングの正確性と利益を分析することができ、それぞれ7.10%と8.95%向上することを示した。
– 我々はまた、コントラスティブ学習とドメイン適応にテストデータを組み込み、わずかなテストデータにラベルを付けることで、モデルのパフォーマンスをさらに向上させることを示した。


FinTech lending (e.g., micro-lending) has played a significant role in facilitating financial inclusion. It has reduced processing times and costs, enhanced the user experience, and made it possible for people to obtain loans who may not have qualified for credit from traditional lenders. However, there are concerns about the potentially biased algorithmic decision-making during loan screening. Machine learning algorithms used to evaluate credit quality can be influenced by representation bias in the training data, as we only have access to the default outcome labels of approved loan applications, for which the borrowers’ socioeconomic characteristics are better than those of rejected ones. In this case, the model trained on the labeled data performs well on the historically approved population, but does not generalize well to borrowers of low socioeconomic background. In this paper, we investigate the problem of representation bias in loan screening for a real-world FinTech lending platform. We propose a new Transformer-based sequential loan screening model with self-supervised contrastive learning and domain adaptation to tackle this challenging issue. We use contrastive learning to train our feature extractor on unapproved (unlabeled) loan applications and use domain adaptation to generalize the performance of our label predictor. We demonstrate the effectiveness of our model through extensive experimentation in the real-world micro-lending setting. Our results show that our model significantly promotes the inclusiveness of funding decisions, while also improving loan screening accuracy and profit by 7.10% and 8.95%, respectively. We also show that incorporating the test data into contrastive learning and domain adaptation and labeling a small ratio of test data can further boost model performance.


著者 Xiyang Hu,Yan Huang,Beibei Li,Tian Lu
発行日 2023-05-10 01:11:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.CY, cs.LG パーマリンク