Accelerate Support Vector Clustering via Spectrum-Preserving Data Compression

要約

タイトル:Spectrum-Preserving Data Compression を用いた Support Vector Clustering の高速化
要約:
– Support Vector Clustering は重要なクラスタリング方法であるが、計算に時間がかかるためスケーラビリティの問題がある。
– 本論文では Spectrum-Preserving Data Compression を用いて Support Vector Clustering を高速化する。
– 具体的には、元のデータセットをスペクトル的に代表的な集約データポイントに圧縮し、それに対して標準的な Support Vector Clustering を実行する。そして、圧縮されたデータセットのクラスタリング結果をマッピングし、元のデータセットでのクラスタを発見する。
– 実験結果により、標準的な Support Vector Clustering よりもクラスタリング品質を犠牲にすることなく、大幅な高速化が可能であることが示された。

要約(オリジナル)

Support vector clustering is an important clustering method. However, it suffers from a scalability issue due to its computational expensive cluster assignment step. In this paper we accelertate the support vector clustering via spectrum-preserving data compression. Specifically, we first compress the original data set into a small amount of spectrally representative aggregated data points. Then, we perform standard support vector clustering on the compressed data set. Finally, we map the clustering results of the compressed data set back to discover the clusters in the original data set. Our extensive experimental results on real-world data set demonstrate dramatically speedups over standard support vector clustering without sacrificing clustering quality.

arxiv情報

著者 Yuxuan Song,Yongyu Wang
発行日 2023-04-21 07:27:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.LG, stat.ML パーマリンク