GBMST: An Efficient Minimum Spanning Tree Clustering Based on Granular-Ball Computing

要約

既存のクラスタリング手法のほとんどは、各データの距離や密度など、単一の粒度の情報に基づいています。
この最もきめ細かいベースのアプローチは、通常、非効率的であり、ノイズの影響を受けやすくなります。
そこで、多粒度グラニュラー ボールと最小スパニング ツリー (MST) を組み合わせたクラスタリング アルゴリズムを提案します。
粗粒度の粒状ボールを構築し、粒状ボールと MST を使用して、外れ値の影響を大幅に回避し、MST の構築プロセスを加速できる「大規模優先度」に基づくクラスタリング手法を実装します。
いくつかのデータセットでの実験結果は、アルゴリズムの力を示しています。
すべてのコードは https://github.com/xjnine/GBMST で公開されています。

要約(オリジナル)

Most of the existing clustering methods are based on a single granularity of information, such as the distance and density of each data. This most fine-grained based approach is usually inefficient and susceptible to noise. Therefore, we propose a clustering algorithm that combines multi-granularity Granular-Ball and minimum spanning tree (MST). We construct coarsegrained granular-balls, and then use granular-balls and MST to implement the clustering method based on ‘large-scale priority’, which can greatly avoid the influence of outliers and accelerate the construction process of MST. Experimental results on several data sets demonstrate the power of the algorithm. All codes have been released at https://github.com/xjnine/GBMST.

arxiv情報

著者 Jiang Xie,Shuyin Xia,Guoyin Wang,Xinbo Gao
発行日 2023-03-29 05:25:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.DB, cs.LG パーマリンク