Beyond RMSE and MAE: Introducing EAUC to unmask hidden bias and unfairness in dyadic regression models


エンティティのペアの実数値の結果を予測する二項回帰モデルは、多くの分野 (例: レコメンダー システムでの製品に対するユーザーの評価の予測) で基礎的ですが、他の多くの領域 (例: 適切な投与量の概算) では有望であり、研究中です。
– 風変わりだが同様に重要なケースにおけるランダムな予測力。
我々は、二乗平均平方根誤差 (RMSE) や平均絶対誤差 (MAE) などのグローバル誤差メトリックの使用だけでは、偏心バイアスと名付けたこの現象を捉えるには不十分であることを示し、次のように曲線下偏心率面積 (EAUC) を導入します。
また、単純なバイアス除去補正を使用して、モデルのバイアスが低いほど EAUC が低くなり、その逆も相関することを実証することで、EAUC が適切であることも証明します。


Dyadic regression models, which predict real-valued outcomes for pairs of entities, are fundamental in many domains (e.g. predicting the rating of a user to a product in Recommender Systems) and promising and under exploration in many others (e.g. approximating the adequate dosage of a drug for a patient in personalized pharmacology). In this work, we demonstrate that non-uniformity in the observed value distributions of individual entities leads to severely biased predictions in state-of-the-art models, skewing predictions towards the average of observed past values for the entity and providing worse-than-random predictive power in eccentric yet equally important cases. We show that the usage of global error metrics like Root Mean Squared Error (RMSE) and Mean Absolute Error (MAE) is insufficient to capture this phenomenon, which we name eccentricity bias, and we introduce Eccentricity-Area Under the Curve (EAUC) as a new complementary metric that can quantify it in all studied models and datasets. We also prove the adequateness of EAUC by using naive de-biasing corrections to demonstrate that a lower model bias correlates with a lower EAUC and vice-versa. This work contributes a bias-aware evaluation of dyadic regression models to avoid potential unfairness and risks in critical real-world applications of such systems.


著者 Jorge Paz-Ruza,Amparo Alonso-Betanzos,Bertha Guijarro-Berdiñas,Brais Cancela,Carlos Eiras-Franco
発行日 2024-01-19 13:41:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.IR, cs.LG パーマリンク