SDC-HSDD-NDSA: Structure Detecting Cluster by Hierarchical Secondary Directed Differential with Normalized Density and Self-Adaption

要約

密度ベースのクラスタリングは、低密度領域によって分離されている限り、任意の形状のクラスタを識別できるため、最も一般的なクラスタリング アルゴリズムと言えます。
ただし、低密度領域によって分離されていない高密度領域には、複数のクラスターに属する異なる構造が存在する場合もあります。
私たちが知る限り、これまでの密度ベースのクラスタリング アルゴリズムはすべて、そのような構造を検出できませんでした。
この論文では、低密度領域によって分離されたクラスターを検出できるだけでなく、低密度領域によって分離されていない高密度領域内の構造も検出できる、新しい密度ベースのクラスタリングスキームを提供します。
このアルゴリズムは、二次有向微分、階層、正規化密度、および自己適応係数を使用するため、正規化密度と自己適応を備えた階層二次有向微分による構造検出クラスター (SDC-HSDD-NDSA と呼ばれます) と呼ばれます。
このアルゴリズムは、その有効性、堅牢性、粒度の独立性を検証するために複数のデータセットで実行され、結果は、このアルゴリズムが以前のアルゴリズムにはない機能を備えていることを示しています。
Python コードは https://github.com/Hao-B-Shu/SDC-HSDD-NDSA にあります。

要約(オリジナル)

Density-based clustering could be the most popular clustering algorithm since it can identify clusters of arbitrary shape as long as they are separated by low-density regions. However, a high-density region that is not separated by low-density ones might also have different structures belonging to multiple clusters. As far as we know, all previous density-based clustering algorithms fail to detect such structures. In this paper, we provide a novel density-based clustering scheme that can not only detect clusters separated by low-density regions but also detect structures in high-density regions not separated by low-density ones. The algorithm employs secondary directed differential, hierarchy, normalized density, as well as the self-adaption coefficient, and thus is called Structure Detecting Cluster by Hierarchical Secondary Directed Differential with Normalized Density and Self-Adaption, dubbed by SDC-HSDD-NDSA. The algorithm is run on several datasets to verify its effectiveness, robustness, as well as granularity independence, and results demonstrate that it has the ability that previous ones do not have. The Python code is on https://github.com/Hao-B-Shu/SDC-HSDD-NDSA.

arxiv情報

著者 Hao Shu
発行日 2024-10-01 12:45:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク