要約
この論文では、データ ポイントが異なる人口統計グループからのものである公平範囲クラスタリング問題を研究します。目標は、各グループが中心セット内で少なくとも最小限に表され、どのグループも支配的でないように、最小のクラスタリング コストで $k$ 中心を選択することです。
中心が設定されます。
より正確には、計量空間 $(P,d)$ 内の $n$ 点の集合が与えられ、各点は $\ell$ の異なる人口統計の 1 つに属します (つまり、 $P = P_1 \uplus P_2 \uplus \cdots
\uplus P_\ell$) と、各グループの必要な中心数に対する $\ell$ 間隔 $[\alpha_1, \beta_1], \cdots, [\alpha_\ell, \beta_\ell]$ のセット、
目標は、最小の $\ell_p$ クラスタリング コスト (つまり $(\sum_{v\in P} d(v,C)^p)^{1/p を持つ $k$ 中心 $C$ のセットを選択することです
}$) 各グループ $i\in \ell$ に対して $|C\cap P_i|
\in [\alpha_i, \beta_i]$。
特に、公正範囲 $\ell_p$-クラスタリングは、特殊なケースとして公正範囲 $k$-center、$k$-median、および $k$-means をキャプチャします。
この研究では、$p\in [1,\infty)$ のすべての値に対する公平な範囲 $\ell_p$ クラスタリングのための効率的な定数因子近似アルゴリズムを提供します。
要約(オリジナル)
This paper studies the fair range clustering problem in which the data points are from different demographic groups and the goal is to pick $k$ centers with the minimum clustering cost such that each group is at least minimally represented in the centers set and no group dominates the centers set. More precisely, given a set of $n$ points in a metric space $(P,d)$ where each point belongs to one of the $\ell$ different demographics (i.e., $P = P_1 \uplus P_2 \uplus \cdots \uplus P_\ell$) and a set of $\ell$ intervals $[\alpha_1, \beta_1], \cdots, [\alpha_\ell, \beta_\ell]$ on desired number of centers from each group, the goal is to pick a set of $k$ centers $C$ with minimum $\ell_p$-clustering cost (i.e., $(\sum_{v\in P} d(v,C)^p)^{1/p}$) such that for each group $i\in \ell$, $|C\cap P_i| \in [\alpha_i, \beta_i]$. In particular, the fair range $\ell_p$-clustering captures fair range $k$-center, $k$-median and $k$-means as its special cases. In this work, we provide efficient constant factor approximation algorithms for fair range $\ell_p$-clustering for all values of $p\in [1,\infty)$.
arxiv情報
著者 | Sèdjro S. Hotegni,Sepideh Mahabadi,Ali Vakilian |
発行日 | 2023-06-22 05:19:54+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google