Provable Imbalanced Point Clustering


不均衡なポイントクラスタリングの近似を計算するための効率的で証明可能な方法、つまり$ \ mathbb {r}^d $のポイントのセットに$ k $ centersを適合させることをお勧めします。
この目的のために、私たちは\ emph {coresets}を利用します。これは、論文のコンテキストでは、特定のセットのすべてのモデルのフィッティング損失を近似する$ \ mathbb {r}^d $の基本的に重み付けされたポイントセットであり、$ 1 \ pm \ varepsilon $の乗算係数に近似します。
また、Choice Clusteringを提案します。これは、クラスタリングアルゴリズムを組み合わせることで、それぞれよりもパフォーマンスが向上します。


We suggest efficient and provable methods to compute an approximation for imbalanced point clustering, that is, fitting $k$-centers to a set of points in $\mathbb{R}^d$, for any $d,k\geq 1$. To this end, we utilize \emph{coresets}, which, in the context of the paper, are essentially weighted sets of points in $\mathbb{R}^d$ that approximate the fitting loss for every model in a given set, up to a multiplicative factor of $1\pm\varepsilon$. We provide [Section 3 and Section E in the appendix] experiments that show the empirical contribution of our suggested methods for real images (novel and reference), synthetic data, and real-world data. We also propose choice clustering, which by combining clustering algorithms yields better performance than each one separately.


著者 David Denisov,Dan Feldman,Shlomi Dolev,Michael Segal
発行日 2025-03-12 14:18:23+00:00
