要約
この論文では、Dasgupta のコスト関数に関する 2 つの効率的な階層クラスタリング (HC) アルゴリズムを紹介します。
明確なクラスター構造を持つ入力グラフ $G$ に対して、設計されたアルゴリズムは入力サイズ $G$ でほぼ線形時間で実行され、Dasgupta のコストに関して $O(1)$ 近似の HC ツリーを返します。
関数。
私たちは、合成および実世界のデータセットに関する以前の最先端のアルゴリズムとアルゴリズムのパフォーマンスを比較し、私たちが設計したアルゴリズムが、はるかに短い実行時間で同等またはより優れた HC ツリーを生成することを示します。
要約(オリジナル)
This paper presents two efficient hierarchical clustering (HC) algorithms with respect to Dasgupta’s cost function. For any input graph $G$ with a clear cluster-structure, our designed algorithms run in nearly-linear time in the input size of $G$, and return an $O(1)$-approximate HC tree with respect to Dasgupta’s cost function. We compare the performance of our algorithm against the previous state-of-the-art on synthetic and real-world datasets and show that our designed algorithm produces comparable or better HC trees with much lower running time.
arxiv情報
著者 | Steinar Laenen,Bogdan-Adrian Manghiuc,He Sun |
発行日 | 2023-06-16 16:31:46+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google