Towards High-Performance Exploratory Data Analysis (EDA) Via Stable Equilibrium Point

要約

探索的データ分析 (EDA) は、データ サイエンス プロジェクトにとって重要な手順です。
この研究では、EDA の効率とソリューションの品質を向上させるための安定平衡点 (SEP) ベースのフレームワークを導入します。
SEP を代表点として活用することで、大規模なデータセットに対する高品質なクラスタリングとデータ視覚化を生成することを目的としています。
提案された方法の非常にユニークな特性は、SEP がデータセットのクラスタリング特性を直接エンコードすることです。
従来の最先端のクラスタリングおよびデータ視覚化方法と比較して、提案された方法により、大規模なデータ分析タスクの計算効率とソリューションの品質を大幅に向上させることができます。

要約(オリジナル)

Exploratory data analysis (EDA) is a vital procedure for data science projects. In this work, we introduce a stable equilibrium point (SEP) – based framework for improving the efficiency and solution quality of EDA. By exploiting the SEPs to be the representative points, our approach aims to generate high-quality clustering and data visualization for large-scale data sets. A very unique property of the proposed method is that the SEPs will directly encode the clustering properties of data sets. Compared with prior state-of-the-art clustering and data visualization methods, the proposed methods allow substantially improving computing efficiency and solution quality for large-scale data analysis tasks.

arxiv情報

著者 Yuxuan Song,Yongyu Wang
発行日 2023-06-07 13:31:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク