要約
以下の一般的なクラスタリング問題の研究を開始します。
$k$ 中心の集合 $X$ を見つけ、各データ点を中心の 1 つに割り当てることによって、データ点の特定の集合 $P$ を $k$ クラスターに分割しようとします。
X$ の中心 $x\ で表されるクラスターのコストは、$x$ に割り当てられた点の距離のベクトルの単調対称ノルム $f$ (内部ノルム) です。
目標は、クラスター コストのベクトルのノルム $g$ (外部ノルム) を最小化することです。
$(f,g)$-Clustering と呼ばれるこの問題は、 $k$-Center 、 $k$-Median 、 Min-Sum of Radii 、 Min-Load $k$-Clustering などの多くの基本的なクラスタリング問題を一般化します。
。
最近の研究 (Chakrabarty、Swamy [STOC’19]) では、$k$-Median や $k$-Center などのクラスター構造を意識しない標準目標を研究しています。
対照的に、私たちの問題は、半径の最小合計と最小負荷 $k$ クラスタリングを含むクラスター対応の目標をモデル化します。
主な成果は以下の通りです。
まず、内部ノルム ($\textsf{top}_\ell$) が合計される $(\textsf{top}_\ell,\mathcal{L}_1)$-Clustering の定因数近似アルゴリズムを設計します。
$\ell$ の最大距離。
次に、外側ノルムが $\textsf{top}_\ell$ の凸結合である $(\mathcal{L}_\infty,\textsf{Ord})$-Clustering の定因数近似\ を設計します。
ノルム (順序重み付きノルム)。
要約(オリジナル)
We initiate the study of the following general clustering problem. We seek to partition a given set $P$ of data points into $k$ clusters by finding a set $X$ of $k$ centers and assigning each data point to one of the centers. The cost of a cluster, represented by a center $x\in X$, is a monotone, symmetric norm $f$ (inner norm) of the vector of distances of points assigned to $x$. The goal is to minimize a norm $g$ (outer norm) of the vector of cluster costs. This problem, which we call $(f,g)$-Clustering, generalizes many fundamental clustering problems such as $k$-Center, $k$-Median , Min-Sum of Radii, and Min-Load $k$-Clustering . A recent line of research (Chakrabarty, Swamy [STOC’19]) studies norm objectives that are oblivious to the cluster structure such as $k$-Median and $k$-Center. In contrast, our problem models cluster-aware objectives including Min-Sum of Radii and Min-Load $k$-Clustering. Our main results are as follows. First, we design a constant-factor approximation algorithm for $(\textsf{top}_\ell,\mathcal{L}_1)$-Clustering where the inner norm ($\textsf{top}_\ell$) sums over the $\ell$ largest distances. Second, we design a constant-factor approximation\ for $(\mathcal{L}_\infty,\textsf{Ord})$-Clustering where the outer norm is a convex combination of $\textsf{top}_\ell$ norms (ordered weighted norm).
arxiv情報
著者 | Martin G. Herold,Evangelos Kipouridis,Joachim Spoerhase |
発行日 | 2024-10-31 16:33:40+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google