Feature Clock: High-Dimensional Effects in Two-Dimensional Plots

要約

人間は高次元のデータを認識して解釈するのに苦労しています。
したがって、高次元データは視覚化のために 2 次元に投影されることがよくあります。
多くのアプリケーションは複雑な非線形次元削減技術の恩恵を受けていますが、個々の高次元特徴の効果を 2 次元空間で説明するのは困難です。
ほとんどの視覚化ソリューションは複数の 2 次元プロットを使用し、それぞれが 1 つの高次元特徴の効果を 2 次元で示します。
このアプローチでは、k 次元の入力空間の k プロットを視覚的に検査する必要が生じます。
私たちのソリューション、Feature Clock は、2 次元で描かれたデータ構造に対する元の特徴の影響を把握するために、これらの k プロットを検査する必要性を排除する新しいアプローチを提供します。
Feature Clock は、埋め込みデータの視覚化の説明可能性とコンパクトさを強化し、オープンソースの Python ライブラリで利用できます。

要約(オリジナル)

Humans struggle to perceive and interpret high-dimensional data. Therefore, high-dimensional data are often projected into two dimensions for visualization. Many applications benefit from complex nonlinear dimensionality reduction techniques, but the effects of individual high-dimensional features are hard to explain in the two-dimensional space. Most visualization solutions use multiple two-dimensional plots, each showing the effect of one high-dimensional feature in two dimensions; this approach creates a need for a visual inspection of k plots for a k-dimensional input space. Our solution, Feature Clock, provides a novel approach that eliminates the need to inspect these k plots to grasp the influence of original features on the data structure depicted in two dimensions. Feature Clock enhances the explainability and compactness of visualizations of embedded data and is available in an open-source Python library.

arxiv情報

著者 Olga Ovcharenko,Rita Sevastjanova,Valentina Boeva
発行日 2024-08-06 12:24:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク