要約
クラスター分析、またはクラスタリングは、多くの科学および工学ドメインで重要な役割を果たします。
過去数十年にわたって提案された豊富なクラスタリング方法にもかかわらず、各方法は通常、特定のシナリオ向けに設計されており、実際のアプリケーションで特定の制限を提示します。
この論文では、深度ベースのローカルセンタークラスタリング(DLCC)を提案します。
この新しい方法では、多変量空間でサンプルポイントの中心外向きの順序を生成することが知られているデータの深さを利用しています。
ただし、データの深さは通常、{データ}のマルチモーダル特性をキャプチャできません。これは、クラスタリングのコンテキストで最も重要なことです。
これを克服するために、DLCCは{data}のサブセットに基づくデータの深さのローカルバージョンを使用します。
これから、ローカルセンターを特定することができ、さまざまな形状のクラスターを特定できます。
さらに、{非凸クラスター}のクラスタリングパフォーマンスを評価するために、密度ベースのクラスタリングに基づいた新しい内部メトリックを提案します。
全体として、DLCCは、従来のクラスタリング方法のいくつかの制限を克服していると思われる柔軟なクラスタリングアプローチであり、それにより、幅広いアプリケーションシナリオにわたってデータ分析機能を強化します。
要約(オリジナル)
Cluster analysis, or clustering, plays a crucial role across numerous scientific and engineering domains. Despite the wealth of clustering methods proposed over the past decades, each method is typically designed for specific scenarios and presents certain limitations in practical applications. In this paper, we propose depth-based local center clustering (DLCC). This novel method makes use of data depth, which is known to produce a center-outward ordering of sample points in a multivariate space. However, data depth typically fails to capture the multimodal characteristics of {data}, something of the utmost importance in the context of clustering. To overcome this, DLCC makes use of a local version of data depth that is based on subsets of {data}. From this, local centers can be identified as well as clusters of varying shapes. Furthermore, we propose a new internal metric based on density-based clustering to evaluate clustering performance on {non-convex clusters}. Overall, DLCC is a flexible clustering approach that seems to overcome some limitations of traditional clustering methods, thereby enhancing data analysis capabilities across a wide range of application scenarios.
arxiv情報
著者 | Siyi Wang,Alexandre Leblanc,Paul D. McNicholas |
発行日 | 2025-05-14 16:08:11+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google