Mitigating Discrimination in Insurance with Wasserstein Barycenters

要約

保険業界は、潜在的な顧客の特性に基づくリスクの予測に大きく依存しています。
このようなモデルの使用は一般的ですが、そのような慣行が性別や人種などの敏感な特徴に基づく差別を永続させることを研究者は長年指摘してきました。
このような差別は多くの場合、過去のデータのバイアスに起因する可能性があることを考慮すると、排除または少なくとも緩和が望ましい。
従来のモデルから機械学習ベースの予測への移行に伴い、価格設定プロセスで敏感な変数を単純に除外するだけでは効果がないことが判明するため、より大きな緩和を求める声が新たに高まっています。
この記事では、まず、なぜ業界内で予測が必要なのか、そしてなぜバイアスを修正することが、単に敏感な変数を特定するほど簡単ではないのかを調査します。
次に、単純なスケーリングの代わりにワッサーシュタイン重心を使用することでバイアスを緩和することを提案します。
アプローチの効果と有効性を実証するために、実際のデータにそれを採用し、その影響について説明します。

要約(オリジナル)

The insurance industry is heavily reliant on predictions of risks based on characteristics of potential customers. Although the use of said models is common, researchers have long pointed out that such practices perpetuate discrimination based on sensitive features such as gender or race. Given that such discrimination can often be attributed to historical data biases, an elimination or at least mitigation is desirable. With the shift from more traditional models to machine-learning based predictions, calls for greater mitigation have grown anew, as simply excluding sensitive variables in the pricing process can be shown to be ineffective. In this article, we first investigate why predictions are a necessity within the industry and why correcting biases is not as straightforward as simply identifying a sensitive variable. We then propose to ease the biases through the use of Wasserstein barycenters instead of simple scaling. To demonstrate the effects and effectiveness of the approach we employ it on real data and discuss its implications.

arxiv情報

著者 Arthur Charpentier,François Hu,Philipp Ratz
発行日 2023-06-22 14:27:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CY, cs.LG, stat.ML パーマリンク