Provable Imbalanced Point Clustering

要約

不均衡なポイントクラスタリングの近似を計算するための効率的で証明可能な方法、つまり$ \ mathbb {r}^d $のポイントのセットに$ k $ centersを適合させることをお勧めします。
この目的のために、私たちは\ emph {coresets}を利用します。これは、論文のコンテキストでは、特定のセットのすべてのモデルのフィッティング損失を近似する$ \ mathbb {r}^d $の基本的に重み付けされたポイントセットであり、$ 1 \ pm \ varepsilon $の乗算係数に近似します。
[付録のセクション3とセクションE]実験を提供します。これは、実際の画像(新規および参照)、合成データ、および実際のデータのための提案された方法の経験的貢献を示しています。
また、Choice Clusteringを提案します。これは、クラスタリングアルゴリズムを組み合わせることで、それぞれよりもパフォーマンスが向上します。

要約(オリジナル)

We suggest efficient and provable methods to compute an approximation for imbalanced point clustering, that is, fitting $k$-centers to a set of points in $\mathbb{R}^d$, for any $d,k\geq 1$. To this end, we utilize \emph{coresets}, which, in the context of the paper, are essentially weighted sets of points in $\mathbb{R}^d$ that approximate the fitting loss for every model in a given set, up to a multiplicative factor of $1\pm\varepsilon$. We provide [Section 3 and Section E in the appendix] experiments that show the empirical contribution of our suggested methods for real images (novel and reference), synthetic data, and real-world data. We also propose choice clustering, which by combining clustering algorithms yields better performance than each one separately.

arxiv情報

著者 David Denisov,Dan Feldman,Shlomi Dolev,Michael Segal
発行日 2025-03-12 14:18:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク