A Distributed Block Chebyshev-Davidson Algorithm for Parallel Spectral Clustering

要約

スペクトル クラスタリングにおけるスペクトル解析のための大規模な主要固有値問題を解決するための分散ブロック チェビシェフ-デイビッドソン アルゴリズムを開発します。
まず、チェビシェフ-デイビッドソン アルゴリズムの効率は固有値スペクトルの事前知識に依存しており、その推定にはコストがかかる可能性があります。
この問題は、スペクトル クラスタリングにおけるラプラシアン行列または正規化ラプラシアン行列の解析スペクトル推定によって軽減でき、提案されたアルゴリズムはスペクトル クラスタリングに対して非常に効率的になります。
第二に、提案されたアルゴリズムをビッグデータの分析に対応できるようにするために、魅力的なスケーラビリティを備えた分散並列バージョンが開発されました。
並列計算による高速化は、$\sqrt{p}$ にほぼ相当します ($p$ はプロセス数を示します)。
{並列コンピューティング環境でスペクトル クラスタリングに使用される既存の固有ソルバーと比較して、スペクトル クラスタリングの効率とスケーラビリティの利点を実証するために数値結果が提供されます。}

要約(オリジナル)

We develop a distributed Block Chebyshev-Davidson algorithm to solve large-scale leading eigenvalue problems for spectral analysis in spectral clustering. First, the efficiency of the Chebyshev-Davidson algorithm relies on the prior knowledge of the eigenvalue spectrum, which could be expensive to estimate. This issue can be lessened by the analytic spectrum estimation of the Laplacian or normalized Laplacian matrices in spectral clustering, making the proposed algorithm very efficient for spectral clustering. Second, to make the proposed algorithm capable of analyzing big data, a distributed and parallel version has been developed with attractive scalability. The speedup by parallel computing is approximately equivalent to $\sqrt{p}$, where $p$ denotes the number of processes. {Numerical results will be provided to demonstrate its efficiency in spectral clustering and scalability advantage over existing eigensolvers used for spectral clustering in parallel computing environments.}

arxiv情報

著者 Qiyuan Pang,Haizhao Yang
発行日 2024-01-05 16:40:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DC, cs.LG, cs.NA, math.NA パーマリンク