Do you know what q-means?

要約

クラスタリングは、大規模なデータセットを分析するための最も重要なツールの 1 つであり、おそらく最も一般的なクラスタリング アルゴリズムは、$k$-means のロイド反復法です。
この反復では、$N$ ベクトル $v_1,\dots,v_N\in\mathbb{R}^d$ を受け取り、$k$ 重心 $c_1,\dots,c_k\in\mathbb{R}^d$ を出力します。
これらは、どの重心が特定のベクトルに最も近いかに基づいて、ベクトルをクラスターに分割します。
我々は、Kerenidis、Landman、Luongo、Prakash (2019) によって元々提案された量子アルゴリズムである「$q$-means」アルゴリズムの全体的に改良されたバージョンを提示します。これは、近似バージョンである $\varepsilon$-$k$-means を実行します。
$k$ の – クラスタリングを意味します。
このアルゴリズムは、以前の研究の量子線形代数プリミティブには依存せず、代わりに QRAM のみを使用して、現在の反復のクラスターに基づいて単純な状態を準備および測定します。
時間計算量は $O\big(\frac{k^{2}}{\varepsilon^2}(\sqrt{k}d + \log(Nd))\big)$ であり、$N への多対数依存性が維持されます。
$ 他のパラメータのほとんどへの依存性を改善しながら。
また、 $O\big(\frac{k^{2}}{\varepsilon^2}(kd + \log(Nd) で実行される $\varepsilon$-$k$-means の「逆量子化」アルゴリズムも提示します。
)\big)$ 時間。
特に、この古典的なアルゴリズムは、量子アルゴリズムによって達成される $N$ への多対数依存性と一致します。

要約(オリジナル)

Clustering is one of the most important tools for analysis of large datasets, and perhaps the most popular clustering algorithm is Lloyd’s iteration for $k$-means. This iteration takes $N$ vectors $v_1,\dots,v_N\in\mathbb{R}^d$ and outputs $k$ centroids $c_1,\dots,c_k\in\mathbb{R}^d$; these partition the vectors into clusters based on which centroid is closest to a particular vector. We present an overall improved version of the ‘$q$-means’ algorithm, the quantum algorithm originally proposed by Kerenidis, Landman, Luongo, and Prakash (2019) which performs $\varepsilon$-$k$-means, an approximate version of $k$-means clustering. This algorithm does not rely on the quantum linear algebra primitives of prior work, instead only using its QRAM to prepare and measure simple states based on the current iteration’s clusters. The time complexity is $O\big(\frac{k^{2}}{\varepsilon^2}(\sqrt{k}d + \log(Nd))\big)$ and maintains the polylogarithmic dependence on $N$ while improving the dependence on most of the other parameters. We also present a ‘dequantized’ algorithm for $\varepsilon$-$k$-means which runs in $O\big(\frac{k^{2}}{\varepsilon^2}(kd + \log(Nd))\big)$ time. Notably, this classical algorithm matches the polylogarithmic dependence on $N$ attained by the quantum algorithms.

arxiv情報

著者 João F. Doriguello,Alessandro Luongo,Ewin Tang
発行日 2023-08-18 17:52:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DS, cs.LG, quant-ph パーマリンク