Parameterized Approximation for Robust Clustering in Discrete Geometric Spaces

要約

古典的な $k$-Median、$k$-Means、$k$-Center 問題を一般化する、よく研究されたロバスト $(k, z)$-Clustering 問題を検討します。
定数 $z\ge 1$ が与えられると、ロバスト $(k, z)$-Clustering への入力は、計量空間 $(M,\delta)$ 内の $n$ 重み付き点のセット $P$ と正の
整数 $k$。
さらに、各点は $m$ のさまざまなグループ $S_1,S_2,\ldots,S_m$ の 1 つ (または複数) に属します。
私たちの目標は、 $\max_{i \in [m]} \sum_{p \in S_i} w(p) \delta(p,X)^z$ となる $k$ 中心の集合 $X$ を見つけることです。
最小化されます。
この問題は、ロバストな最適化の領域で発生します [Anthony、Goyal、Gupta、Nagarajan、Math.
オペラ。
解像度
2010] アルゴリズムの公平性において。
多項式時間計算の場合、$O(\log m/\log\log m)$ の近似係数が知られています [Makarychev、Vakilian、COLT $2021$]。これは、ライン メトリックであっても、もっともらしい複雑性の仮定の下では厳密です。
FPT 時間については、$(3^z+\epsilon)$ 近似アルゴリズムがあり、GAP-ETH の下では厳密です [Goyal, Jaiswal, Inf.
手順
手紙、2023]。
一般的な離散計量の厳しい下限を動機として、データ分析アプリケーションで重要な役割を果たす、(離散)高次元ユークリッド設定や低倍加次元の計量などの \emph{幾何} 空間に焦点を当てます。
まず、普遍定数 $\eta_0 >0.0006$ に対して、離散高次元ユークリッド空間に対する $3^z(1-\eta_{0})$-factor FPT 近似アルゴリズムを考案し、それによって一般的な計量の下限をバイパスします。
次元 $\Theta(\log n)$ の $k$-Center の特殊な場合でも $(\sqrt{3/2}- o(1))$ であることを示すことで、この結果を補完します。
FPT アルゴリズム。
最後に、準対数倍加次元の計量に対する FPT $(1+\epsilon)$ 近似スキーム (EPAS) を設計することで、FPT 近似ランドスケープを完成させます。

要約(オリジナル)

We consider the well-studied Robust $(k, z)$-Clustering problem, which generalizes the classic $k$-Median, $k$-Means, and $k$-Center problems. Given a constant $z\ge 1$, the input to Robust $(k, z)$-Clustering is a set $P$ of $n$ weighted points in a metric space $(M,\delta)$ and a positive integer $k$. Further, each point belongs to one (or more) of the $m$ many different groups $S_1,S_2,\ldots,S_m$. Our goal is to find a set $X$ of $k$ centers such that $\max_{i \in [m]} \sum_{p \in S_i} w(p) \delta(p,X)^z$ is minimized. This problem arises in the domains of robust optimization [Anthony, Goyal, Gupta, Nagarajan, Math. Oper. Res. 2010] and in algorithmic fairness. For polynomial time computation, an approximation factor of $O(\log m/\log\log m)$ is known [Makarychev, Vakilian, COLT $2021$], which is tight under a plausible complexity assumption even in the line metrics. For FPT time, there is a $(3^z+\epsilon)$-approximation algorithm, which is tight under GAP-ETH [Goyal, Jaiswal, Inf. Proc. Letters, 2023]. Motivated by the tight lower bounds for general discrete metrics, we focus on \emph{geometric} spaces such as the (discrete) high-dimensional Euclidean setting and metrics of low doubling dimension, which play an important role in data analysis applications. First, for a universal constant $\eta_0 >0.0006$, we devise a $3^z(1-\eta_{0})$-factor FPT approximation algorithm for discrete high-dimensional Euclidean spaces thereby bypassing the lower bound for general metrics. We complement this result by showing that even the special case of $k$-Center in dimension $\Theta(\log n)$ is $(\sqrt{3/2}- o(1))$-hard to approximate for FPT algorithms. Finally, we complete the FPT approximation landscape by designing an FPT $(1+\epsilon)$-approximation scheme (EPAS) for the metric of sub-logarithmic doubling dimension.

arxiv情報

著者 Fateme Abbasi,Sandip Banerjee,Jarosław Byrka,Parinya Chalermsook,Ameet Gadekar,Kamyar Khodamoradi,Dániel Marx,Roohani Sharma,Joachim Spoerhase
発行日 2024-09-16 14:13:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CG, cs.DS, cs.LG パーマリンク