Debiasing Alternative Data for Credit Underwriting Using Causal Inference

要約

代替データは、貸し手が借り手の信用力を評価するための貴重な洞察を提供し、これにより、十分なサービスを受けていないグループへの信用アクセスを拡大し、借り手のコストを削減することができます。
しかし、一部の形式の代替データは、人種や性別などの保護された階級の違法な代理として機能し、レッドラインを引き起こす可能性があるため、歴史的に信用引受から除外されてきました。
私たちは、教師あり機械学習モデルに因果推論を適用して代替データのバイアスを除去し、信用引受に使用できるようにする方法を提案します。
私たちは、アルゴリズムを公的信用データセットに対して使用して、理論的に堅牢な無差別保証を提供しながら、さまざまな人種グループにわたるモデルの精度を向上させる方法を実証します。

要約(オリジナル)

Alternative data provides valuable insights for lenders to evaluate a borrower’s creditworthiness, which could help expand credit access to underserved groups and lower costs for borrowers. But some forms of alternative data have historically been excluded from credit underwriting because it could act as an illegal proxy for a protected class like race or gender, causing redlining. We propose a method for applying causal inference to a supervised machine learning model to debias alternative data so that it might be used for credit underwriting. We demonstrate how our algorithm can be used against a public credit dataset to improve model accuracy across different racial groups, while providing theoretically robust nondiscrimination guarantees.

arxiv情報

著者 Chris Lam
発行日 2024-10-31 17:12:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CE, cs.LG, q-fin.RM パーマリンク