要約
現実世界のデータセットの欠点に対処するために、恣意的かつ無差別なデータ破損を克服する堅牢な学習アルゴリズムが設計されています。
ただし、実際のデータ収集プロセスでは、トレーニング データセットの特定のパーティションに局所的なデータ破損のパターンが発生する可能性があります。
重複する部分母集団の豊富なコレクションから人々についての予測を行うために学習されたモデルが展開される重要なアプリケーションを動機として、各部分母集団に対する堅牢性の保証がその部分母集団内のデータ破損の量によってのみ低下する、マルチグループの堅牢なアルゴリズムの研究を開始します。
データ破損が部分母集団全体に均一に分布していない場合、当社のアルゴリズムは、データ破損と影響を受ける部分母集団の関連性を考慮しない標準的な保証よりも、より有意義な堅牢性保証を提供します。
私たちの技術は、マルチグループの公平性と堅牢性の間に新たな関係を確立します。
要約(オリジナル)
To address the shortcomings of real-world datasets, robust learning algorithms have been designed to overcome arbitrary and indiscriminate data corruption. However, practical processes of gathering data may lead to patterns of data corruption that are localized to specific partitions of the training dataset. Motivated by critical applications where the learned model is deployed to make predictions about people from a rich collection of overlapping subpopulations, we initiate the study of multigroup robust algorithms whose robustness guarantees for each subpopulation only degrade with the amount of data corruption inside that subpopulation. When the data corruption is not distributed uniformly over subpopulations, our algorithms provide more meaningful robustness guarantees than standard guarantees that are oblivious to how the data corruption and the affected subpopulations are related. Our techniques establish a new connection between multigroup fairness and robustness.
arxiv情報
| 著者 | Lunjia Hu,Charlotte Peale,Judy Hanwen Shen | 
| 発行日 | 2024-05-01 16:35:04+00:00 | 
| arxivサイト | arxiv_id(pdf) | 
提供元, 利用サービス
arxiv.jp, Google
