Beyond RMSE and MAE: Introducing EAUC to unmask hidden bias and unfairness in dyadic regression models


エンティティのペアの実数値予測を出力する二項回帰モデルは、多くの領域 (例: レコメンダー システムでのユーザー製品評価の取得) では基礎的ですが、その他の領域 (例: 個別化された薬理学における患者の薬剤投与量の調整) では有望ですがまだ研究中です。
私たちは、二乗平均平方根誤差 (RMSE) のようなグローバルな誤差測定基準では、この偏りを捉えるには不十分であることを示し、研究されたすべてのドメインとモデルでそれを定量化できる新しい補完的な測定基準として、曲線下偏心率面積 (EAUC) を導入します。
私たちは、単純なトレーニング後のバイアス補正を実験することで EAUC の直感的な解釈を証明し、公平なモデルの構築をガイドするために EAUC を使用するための他のオプションを理論化します。


Dyadic regression models, which output real-valued predictions for pairs of entities, are fundamental in many domains (e.g. obtaining user-product ratings in Recommender Systems) and promising and under exploration in others (e.g. tuning patient-drug dosages in personalized pharmacology). In this work, we prove that non-uniform observed value distributions of individual entities lead to severe biases in state-of-the-art models, skewing predictions towards the average of observed past values for the entity and providing worse-than-random predictive power in eccentric yet crucial cases; we name this phenomenon eccentricity bias. We show that global error metrics like Root Mean Squared Error (RMSE) are insufficient to capture this bias, and we introduce Eccentricity-Area Under the Curve (EAUC) as a novel complementary metric that can quantify it in all studied domains and models. We prove the intuitive interpretation of EAUC by experimenting with naive post-training bias corrections, and theorize other options to use EAUC to guide the construction of fair models. This work contributes a bias-aware evaluation of dyadic regression to prevent unfairness in critical real-world applications of such systems.


Jorge Paz-Ruza,Amparo Alonso-Betanzos,Bertha Guijarro-Berdiñas,Brais Cancela,Carlos Eiras-Franco
2024-12-30
cs.AI, cs.IR, cs.LG