Enhancing Dimension-Reduced Scatter Plots with Class and Feature Centroids

要約

解釈可能性を向上させるために、高次元の生物医学データに次元削減が適用されることが増えています。
データセットが 2 次元に削減されると、各観測値には x 座標と y 座標が割り当てられ、散布図上の点として表されます。
次元削減に伴う複雑さのため、x 軸と y 軸の意味を解釈することが大きな課題となります。
この研究では、次元削減から得られた x 座標と y 座標を使用してクラスとフィーチャの重心を計算し、散布図に重ねて表示することで、この課題に対処しました。
この方法は、低次元空間を元の高次元空間に接続します。
3 つの神経因性疾患の表現型から得られたデータを使用してこのアプローチの有用性を説明し、クラスと特徴の重心を追加することで散布図の解釈可能性がどのように高まるかを示します。

要約(オリジナル)

Dimension reduction is increasingly applied to high-dimensional biomedical data to improve its interpretability. When datasets are reduced to two dimensions, each observation is assigned an x and y coordinates and is represented as a point on a scatter plot. A significant challenge lies in interpreting the meaning of the x and y axes due to the complexities inherent in dimension reduction. This study addresses this challenge by using the x and y coordinates derived from dimension reduction to calculate class and feature centroids, which can be overlaid onto the scatter plots. This method connects the low-dimension space to the original high-dimensional space. We illustrate the utility of this approach with data derived from the phenotypes of three neurogenetic diseases and demonstrate how the addition of class and feature centroids increases the interpretability of scatter plots.

arxiv情報

著者 Daniel B. Hier,Tayo Obafemi-Ajayi,Gayla R. Olbricht,Devin M. Burns,Sasha Petrenko,Donald C. Wunsch II
発行日 2024-03-29 15:45:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.HC, cs.LG, J.3 パーマリンク