要約
最近開発された比例公平クラスタリングのフレームワークを再検討します。その目的は、大規模で凝集したデータ ポイント (エージェント) のグループに対してより強力なグループ公平性の保証を提供することです。
以前の研究では、このフレームワークを重心クラスタリングに適用しました。エージェントの損失は、そのクラスターに割り当てられた重心までの距離です。
我々は、このフレームワークを非重心クラスタリングに拡張します。そこでは、2 つの比例的公平性基準 (コアとその緩和、完全に正当化された表現 (FJR)) を適応させることで、エージェントの損失がそのクラスター内の他のエージェントの関数となります。
この設定。
我々は、構造化された損失関数の下でのみコアを近似できることを示し、その場合でも、重心クラスタリング用に開発された GreedyCapture アルゴリズムの適応を使用して、確立できる最良の近似を確立できることを示します [Chen et al., 2019;
Micha and Shah、2020] は、自然損失関数としては魅力的ではありません。
対照的に、任意の損失関数の下で正確に緩和 FJR を達成する新しい (非効率な) アルゴリズム GreedyCohesiveClustering を設計し、効率的な GreedyCapture アルゴリズムが FJR の一定近似を達成することを示します。
また、特定のクラスタリング ソリューションの FJR 近似を定数係数まで推定する、効率的な監査アルゴリズムも設計します。
実際のデータに対する私たちの実験では、従来のクラスタリング アルゴリズムは非常に不公平であるのに対し、GreedyCapture はかなり公平で、共通のクラスタリング目標においてわずかな損失しか生じないことがわかりました。
要約(オリジナル)
We revisit the recently developed framework of proportionally fair clustering, where the goal is to provide group fairness guarantees that become stronger for groups of data points (agents) that are large and cohesive. Prior work applies this framework to centroid clustering, where the loss of an agent is its distance to the centroid assigned to its cluster. We expand the framework to non-centroid clustering, where the loss of an agent is a function of the other agents in its cluster, by adapting two proportional fairness criteria — the core and its relaxation, fully justified representation (FJR) — to this setting. We show that the core can be approximated only under structured loss functions, and even then, the best approximation we are able to establish, using an adaptation of the GreedyCapture algorithm developed for centroid clustering [Chen et al., 2019; Micha and Shah, 2020], is unappealing for a natural loss function. In contrast, we design a new (inefficient) algorithm, GreedyCohesiveClustering, which achieves the relaxation FJR exactly under arbitrary loss functions, and show that the efficient GreedyCapture algorithm achieves a constant approximation of FJR. We also design an efficient auditing algorithm, which estimates the FJR approximation of any given clustering solution up to a constant factor. Our experiments on real data suggest that traditional clustering algorithms are highly unfair, whereas GreedyCapture is considerably fairer and incurs only a modest loss in common clustering objectives.
arxiv情報
著者 | Ioannis Caragiannis,Evi Micha,Nisarg Shah |
発行日 | 2024-10-30 17:53:49+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google