要約
後処理アプローチは、直感性、計算コストの低さ、優れたスケーラビリティのために、機械学習モデルの公平性を高めるための顕著なテクニックになりつつあります。
ただし、ほとんどの既存の後処理方法は、タスク固有の公平性測定用に設計されており、単一出力モデルに限定されています。
このホワイトペーパーでは、マルチタスク/マルチクラスの分類と表現学習に使用されるマルチアウトプットモデルのポストプロセッシング方法を紹介し、モデルの分布パリティ、タスクと存在する公平性尺度を強化します。
分布パリティを達成するための既存の方法は、モデルの出力の(逆)累積密度関数に依存しており、単一の出力モデルへの適用性を制限しています。
以前の作品を拡張して、最適な輸送マッピングを使用して、異なるグループ間のモデルの出力を経験的なWasserstein Barycenterに移動することを提案します。
正確なバリセンターとコンピューティングの複雑さを減らすために近似手法が適用され、このプロセスをサンプル外データに拡張するためにカーネル回帰法が提案されています。
私たちの実証研究は、マルチタスク/マルチクラスの分類と表現学習タスクに関するさまざまなベースラインに対する提案されたアプローチを評価し、提案されたアプローチの有効性を実証します。
要約(オリジナル)
The post-processing approaches are becoming prominent techniques to enhance machine learning models’ fairness because of their intuitiveness, low computational cost, and excellent scalability. However, most existing post-processing methods are designed for task-specific fairness measures and are limited to single-output models. In this paper, we introduce a post-processing method for multi-output models, such as the ones used for multi-task/multi-class classification and representation learning, to enhance a model’s distributional parity, a task-agnostic fairness measure. Existing methods for achieving distributional parity rely on the (inverse) cumulative density function of a model’s output, restricting their applicability to single-output models. Extending previous works, we propose to employ optimal transport mappings to move a model’s outputs across different groups towards their empirical Wasserstein barycenter. An approximation technique is applied to reduce the complexity of computing the exact barycenter and a kernel regression method is proposed to extend this process to out-of-sample data. Our empirical studies evaluate the proposed approach against various baselines on multi-task/multi-class classification and representation learning tasks, demonstrating the effectiveness of the proposed approach.
arxiv情報
著者 | Gang Li,Qihang Lin,Ayush Ghosh,Tianbao Yang |
発行日 | 2025-03-20 16:42:22+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google