要約
探索的データ分析 (EDA) は、データ サイエンス プロジェクトにとって重要な手順です。
この研究では、EDA の効率とソリューションの品質を向上させるための安定平衡点 (SEP) ベースのフレームワークを導入します。
SEP を代表点として活用することで、大規模なデータセットに対する高品質なクラスタリングとデータ視覚化を生成することを目的としています。
提案された方法の非常にユニークな特性は、SEP がデータセットのクラスタリング特性を直接エンコードすることです。
従来の最先端のクラスタリングおよびデータ視覚化方法と比較して、提案された方法により、大規模なデータ分析タスクの計算効率とソリューションの品質を大幅に向上させることができます。
要約(オリジナル)
Exploratory data analysis (EDA) is a vital procedure for data science projects. In this work, we introduce a stable equilibrium point (SEP) – based framework for improving the efficiency and solution quality of EDA. By exploiting the SEPs to be the representative points, our approach aims to generate high-quality clustering and data visualization for large-scale data sets. A very unique property of the proposed method is that the SEPs will directly encode the clustering properties of data sets. Compared with prior state-of-the-art clustering and data visualization methods, the proposed methods allow substantially improving computing efficiency and solution quality for large-scale data analysis tasks.
arxiv情報
著者 | Yuxuan Song,Yongyu Wang |
発行日 | 2023-06-07 13:31:57+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google