要約
クラスタリングは、大規模なデータセットを分析するための最も重要なツールの1つであり、おそらく最も人気のあるクラスタリングアルゴリズムは、$ k $ -meansのロイドの反復です。
この反復には、$ n $ vectors $ v = [v_1、\ dots、v_n] \ in \ mathbb {r}^{n \ times d} $と出力$ k $ centroids $ c_1、\ dots、c_k \ in \ mathbb {r}^d $;
これらは、どの重心が特定のベクトルに最も近いかに基づいて、ベクトルをクラスターに分割します。
「$ Q $ -MEANS」アルゴリズムの全体的な改良バージョンを提示します。これは、Kerenidis、Landman、Luongo、およびPrakash(Neurips’19)が最初に提案した量子アルゴリズムで、$ \ varepsilon $ – $ k $ -means、$ k $ k $ -means Clusteringの近似バージョンを実行します。
私たちのアルゴリズムは、以前の研究の量子線形代数プリミティブに依存するのではなく、QRAMを使用して、現在のイテレーションのクラスターと多変量量子振幅推定に基づいて単純な状態を調製するだけです。
時間の複雑さは$ \ widetilde {o} \ big(\ frac {\ | v \ | _f} {\ sqrt {n}} \ frac {k^{5/2}} {\ varepsilon}(\ sqrt {k} + \ log {n} {k} + \ log {n}){\ varepsilon}(\
他のほとんどのパラメーターへの依存を改善しながら、$ n $への対数依存性。
また、$ o \ big(\ | v \ | _f^2} {n} \ frac {k^{2}}}} {\ varepsilon^2}(kd + \ log \ log^log^log \ log^log^log^log + \ log)で実行される$ \ varepsilon $-$ k $ -meansの「定量化された」アルゴリズムも提示します。
特に、この古典的なアルゴリズムは、量子アルゴリズムによって達成された$ n $への対数依存性と一致します。
要約(オリジナル)
Clustering is one of the most important tools for analysis of large datasets, and perhaps the most popular clustering algorithm is Lloyd’s iteration for $k$-means. This iteration takes $n$ vectors $V=[v_1,\dots,v_n]\in\mathbb{R}^{n\times d}$ and outputs $k$ centroids $c_1,\dots,c_k\in\mathbb{R}^d$; these partition the vectors into clusters based on which centroid is closest to a particular vector. We present an overall improved version of the ‘$q$-means’ algorithm, the quantum algorithm originally proposed by Kerenidis, Landman, Luongo, and Prakash (NeurIPS’19) which performs $\varepsilon$-$k$-means, an approximate version of $k$-means clustering. Our algorithm does not rely on quantum linear algebra primitives of prior work, but instead only uses QRAM to prepare simple states based on the current iteration’s clusters and multivariate quantum amplitude estimation. The time complexity is $\widetilde{O}\big(\frac{\|V\|_F}{\sqrt{n}}\frac{k^{5/2}d}{\varepsilon}(\sqrt{k} + \log{n})\big)$ and maintains the logarithmic dependence on $n$ while improving the dependence on most of the other parameters. We also present a ‘dequantized’ algorithm for $\varepsilon$-$k$-means which runs in $O\big(\frac{\|V\|_F^2}{n}\frac{k^{2}}{\varepsilon^2}(kd + \log{n})\big)$ time. Notably, this classical algorithm matches the logarithmic dependence on $n$ attained by the quantum algorithm.
arxiv情報
著者 | Joao F. Doriguello,Alessandro Luongo,Ewin Tang |
発行日 | 2025-03-20 17:47:44+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google