Machine Learning Techniques with Fairness for Prediction of Completion of Drug and Alcohol Rehabilitation

要約

この研究の目的は、ある人が薬物およびアルコールのリハビリテーション プログラムを完了するかどうか、およびその人が参加する回数を予測することです。
この研究は、薬物乱用・精神保健サービス局(SAMHSA)がオクラホマ州の薬物およびアルコールリハビリテーションセンターの入退院データから得た人口統計データに基づいている。
人口統計データは高度にカテゴリカルであるため、9 つの人口統計変数の偏りを軽減するためにバイナリ エンコードが使用され、さまざまな公平性手段が利用されています。
線形基底関数、多項式基底関数、シグモイド基底関数、動径基底関数などのカーネル手法が、サポート ベクター マシンを使用してさまざまなパラメーター範囲で比較され、最適な値が見つかりました。
次に、これらをデシジョン ツリー、ランダム フォレスト、ニューラル ネットワークなどの手法と比較しました。
カテゴリデータの合成少数オーバーサンプリング技術公称 (SMOTEN) を使用して、欠損データの補完によるデータのバランスをとりました。
次に、バイアスを軽減するために 9 つのバイアス変数が交差化され、確率を使用して最悪の場合の比率の公平性の軽減を調べるために二重および三重の相互作用が統合されました。
異種影響、統計パリティ差、条件付き統計パリティ比、人口統計パリティ、人口パリティ比、均等化オッズ、均等化オッズ比、均等化機会、均等化機会比率はすべて、バイナリ シナリオとマルチクラス シナリオの両方で調査されました。

要約(オリジナル)

The aim of this study is to look at predicting whether a person will complete a drug and alcohol rehabilitation program and the number of times a person attends. The study is based on demographic data obtained from Substance Abuse and Mental Health Services Administration (SAMHSA) from both admissions and discharge data from drug and alcohol rehabilitation centers in Oklahoma. Demographic data is highly categorical which led to binary encoding being used and various fairness measures being utilized to mitigate bias of nine demographic variables. Kernel methods such as linear, polynomial, sigmoid, and radial basis functions were compared using support vector machines at various parameter ranges to find the optimal values. These were then compared to methods such as decision trees, random forests, and neural networks. Synthetic Minority Oversampling Technique Nominal (SMOTEN) for categorical data was used to balance the data with imputation for missing data. The nine bias variables were then intersectionalized to mitigate bias and the dual and triple interactions were integrated to use the probabilities to look at worst case ratio fairness mitigation. Disparate Impact, Statistical Parity difference, Conditional Statistical Parity Ratio, Demographic Parity, Demographic Parity Ratio, Equalized Odds, Equalized Odds Ratio, Equal Opportunity, and Equalized Opportunity Ratio were all explored at both the binary and multiclass scenarios.

arxiv情報

著者 Karen Roberts-Licklider,Theodore Trafalis
発行日 2024-04-23 18:09:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CY, cs.LG パーマリンク