要約
タイトル:群知能がデータクラスタリングメカニズムに与える影響
要約:
– データマイニングは、大規模データから興味深く、よくまとまった情報を発見することに焦点を当てています。
– データクラスタリングは、非監視学習の1つであり、似たような特徴を持つデータをグループ化し、物理的にまとめたものです。
– K-meansは、分割クラスタリング手法の1つで、実装が容易であるため広く使用されています。しかし、局所最適解の収束や初期点の感度などの制限があります。
– これらの問題に対処するため、人工蜂コロニーアルゴリズム、アリコロニー最適化、ホタルアルゴリズム、コウモリアルゴリズムなど、自然発生的なスワームベースのアルゴリズムがデータクラスタリングに使用されます。
– これらのアルゴリズムは、データの欠如や一貫性の問題を解決するため、K-meansなどの従来のアプローチと併用されて、より良い結果を得るためのハイブリッドアプローチとして使用されることもあります。
– この論文は、これらの新しいアプローチの性能を検討し、どのアルゴリズムが特定の問題に対して最適かを比較します。
要約(オリジナル)
Data mining focuses on discovering interesting, non-trivial and meaningful information from large datasets. Data clustering is one of the unsupervised and descriptive data mining task which group data based on similarity features and physically stored together. As a partitioning clustering method, K-means is widely used due to its simplicity and easiness of implementation. But this method has limitations such as local optimal convergence and initial point sensibility. Due to these impediments, nature inspired Swarm based algorithms such as Artificial Bee Colony Algorithm, Ant Colony Optimization, Firefly Algorithm, Bat Algorithm and etc. are used for data clustering to cope with larger datasets with lack and inconsistency of data. In some cases, those algorithms are used with traditional approaches such as K-means as hybrid approaches to produce better results. This paper reviews the performances of these new approaches and compares which is best for certain problematic situation.
arxiv情報
著者 | Pitawelayalage Dasun Dileepa Pitawela,Gamage Upeksha Ganegoda |
発行日 | 2023-05-07 08:40:50+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI