Robust Fair Clustering with Group Membership Uncertainty Sets

要約

私たちは、各クラスターが各グループの母集団レベルに近い表現を持つように制約される正規の公平クラスタリング問題を研究します。
大きな注目を集めているにもかかわらず、各点のグループのメンバーシップに関する知識が不完全であるという顕著な問題は表面的に扱われています。
この論文では、割り当てられたグループ メンバーシップが騒々しい設定を検討します。
意思決定者が少数のパラメータを指定する必要がある単純なノイズ モデルを紹介します。
次に、証明可能な \emph{堅牢性} が保証された公平なクラスタリングのためのアルゴリズムを提示します。
私たちのフレームワークにより、意思決定者は堅牢性とクラスタリングの品質の間でトレードオフを行うことができます。
以前の研究とは異なり、私たちのアルゴリズムは最悪の場合の理論的保証によって裏付けられています。
最後に、現実世界のデータセットでアルゴリズムのパフォーマンスを実証的に検証し、既存のベースラインを上回る優れたパフォーマンスを示します。

要約(オリジナル)

We study the canonical fair clustering problem where each cluster is constrained to have close to population-level representation of each group. Despite significant attention, the salient issue of having incomplete knowledge about the group membership of each point has been superficially addressed. In this paper, we consider a setting where the assigned group memberships are noisy. We introduce a simple noise model that requires a small number of parameters to be given by the decision maker. We then present an algorithm for fair clustering with provable \emph{robustness} guarantees. Our framework enables the decision maker to trade off between the robustness and the clustering quality. Unlike previous work, our algorithms are backed by worst-case theoretical guarantees. Finally, we empirically verify the performance of our algorithm on real world datasets and show its superior performance over existing baselines.

arxiv情報

著者 Sharmila Duppala,Juan Luque,John P. Dickerson,Seyed A. Esmaeili
発行日 2024-11-20 17:12:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CY, cs.DS, cs.LG パーマリンク