要約
人間は高次元のデータを知覚し解釈するのに苦労する。そのため、高次元データは可視化のためにしばしば2次元に投影される。多くのアプリケーションは複雑な非線形次元削減技術から利益を得ているが、個々の高次元特徴の効果を2次元空間で説明するのは難しい。ほとんどの可視化ソリューションは、複数の2次元プロットを使用し、それぞれが1つの高次元特徴の効果を2次元で表示します。このアプローチでは、k次元の入力空間に対してk個のプロットを視覚的に検査する必要が生じます。我々のソリューションであるFeature Clockは、2次元で描かれたデータ構造に対するオリジナルの特徴の影響を把握するために、これらのk個のプロットを検査する必要性を排除する新しいアプローチを提供します。Feature Clockは、埋め込みデータの可視化の説明可能性とコンパクト性を向上させ、オープンソースのPythonライブラリで利用可能である。
要約(オリジナル)
Humans struggle to perceive and interpret high-dimensional data. Therefore, high-dimensional data are often projected into two dimensions for visualization. Many applications benefit from complex nonlinear dimensionality reduction techniques, but the effects of individual high-dimensional features are hard to explain in the two-dimensional space. Most visualization solutions use multiple two-dimensional plots, each showing the effect of one high-dimensional feature in two dimensions; this approach creates a need for a visual inspection of k plots for a k-dimensional input space. Our solution, Feature Clock, provides a novel approach that eliminates the need to inspect these k plots to grasp the influence of original features on the data structure depicted in two dimensions. Feature Clock enhances the explainability and compactness of visualizations of embedded data and is available in an open-source Python library.
arxiv情報
著者 | Olga Ovcharenko,Rita Sevastjanova,Valentina Boeva |
発行日 | 2024-08-02 14:31:37+00:00 |
arxivサイト | arxiv_id(pdf) |