要約
この論文では、クラスタリングの分野における教師なし手法の新しいアプローチを紹介します。
適切なベイジアン ブートストラップを使用して既存の文献モデルを強化し、堅牢性と解釈可能性の点で結果を向上させる新しい方法が提案されています。
私たちのアプローチは 2 つのステップで構成されています。K 平均法クラスタリングが事前の導出に使用され、次に適切なベイジアン ブートストラップがアンサンブル クラスタリング アプローチのリサンプリング方法として適用されます。
結果は、シャノンのエントロピーに基づく不確実性の尺度を導入して分析されます。
この提案は、クラスター化されたデータをより適切に表現するだけでなく、クラスターの最適な数を明確に示しています。
経験的結果は、得られた方法論的および経験的進歩を示すシミュレートされたデータで提供されます。
要約(オリジナル)
The paper presents a novel approach for unsupervised techniques in the field of clustering. A new method is proposed to enhance existing literature models using the proper Bayesian bootstrap to improve results in terms of robustness and interpretability. Our approach is organized in two steps: k-means clustering is used for prior elicitation, then proper Bayesian bootstrap is applied as resampling method in an ensemble clustering approach. Results are analyzed introducing measures of uncertainty based on Shannon entropy. The proposal provides clear indication on the optimal number of clusters, as well as a better representation of the clustered data. Empirical results are provided on simulated data showing the methodological and empirical advances obtained.
arxiv情報
著者 | Federico Maria Quetti,Silvia Figini,Elena ballante |
発行日 | 2024-09-13 16:14:54+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google