A Polynomial-Time Approximation for Pairwise Fair $k$-Median Clustering

要約

この作業では、$ \ ell \ ge 2 $グループを使用してペアワイズフェアクラスタリングを研究します。すべてのクラスター$ c $およびすべてのグループ$ i \ in [\ ell] $で、グループ$ i $からの$ c $のポイント数は、$ c $ in $ c $のポイント数を、他のグループ$ j \ in in integerger $ $ $ itの$ c $の$ c $のポイント数でなければなりません。
私たちの知る限り、$ \ ell> 2 $の場合、公正なクラスタリングの問題に関する以前の作業から、この問題については、双方向の近似と指数アルゴリズムのみが続きます。
私たちの作業では、$ \ ell> 2 $のケースに焦点を当てて、最初の多項式時間$ o(k^2 \ cdot \ ell \ cdot t)$を設計します – この問題の近似値は、公平性の制約に違反しない$ k $ -Medianコストを備えています。
近似結果の硬度を提供することによりアルゴリズムの結果を補完します。これは、$ o(\ log k)$の近似係数を持つ多項式時間アルゴリズムが知られている多項式時間アルゴリズムが知られていない$ \ ell = 2 $でさえ、$ \ ell = 2 $が$ k $ medianとほぼ同じくらい硬いことを示しています。

要約(オリジナル)

In this work, we study pairwise fair clustering with $\ell \ge 2$ groups, where for every cluster $C$ and every group $i \in [\ell]$, the number of points in $C$ from group $i$ must be at most $t$ times the number of points in $C$ from any other group $j \in [\ell]$, for a given integer $t$. To the best of our knowledge, only bi-criteria approximation and exponential-time algorithms follow for this problem from the prior work on fair clustering problems when $\ell > 2$. In our work, focusing on the $\ell > 2$ case, we design the first polynomial-time $O(k^2\cdot \ell \cdot t)$-approximation for this problem with $k$-median cost that does not violate the fairness constraints. We complement our algorithmic result by providing hardness of approximation results, which show that our problem even when $\ell=2$ is almost as hard as the popular uniform capacitated $k$-median, for which no polynomial-time algorithm with an approximation factor of $o(\log k)$ is known.

arxiv情報

著者 Sayan Bandyapadhyay,Eden Chlamtáč,Zachary Friggstad,Mahya Jamshidian,Yury Makarychev,Ali Vakilian
発行日 2025-02-27 16:29:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.DS, cs.LG パーマリンク