Spherical Rotation Dimension Reduction with Geometric Loss Functions



– 現代のデータセットは高次元性を示すことが多く、低次元の多様体に属するデータが存在する場合がある。これらの多様体は、データ解析において重要な幾何学的構造を明らかにすることができる。
– 循環的なプロセスの固有の性質を表すことができる細胞周期測定データなどは、そのようなデータの良い例である。
– これらのデータを解析するために、幾何情報を含めた非線形次元削減手法である球面回転成分分析(SRCA)を提案する。
– SRCAは、高次元やサンプル数の少ない場合の両方で動作する汎用性の高い手法である。
– SRCAは球または楕円体を用いて、一般的な理論保証を提供する低ランクの球面表現を提供することで、次元削減中にデータの幾何学的構造を有効に保持する。
– 他の最先端の手法と比較してSRCAの利点を詳しく検討するよう総合的なシミュレーション研究を行い、人間の細胞周期データへの適用に成功している。
– その結果、SRCAは多様体を近似しながら固有の幾何学的構造を維持することで、優れた性能を発揮することが示されている。


Modern datasets often exhibit high dimensionality, yet the data reside in low-dimensional manifolds that can reveal underlying geometric structures critical for data analysis. A prime example of such a dataset is a collection of cell cycle measurements, where the inherently cyclical nature of the process can be represented as a circle or sphere. Motivated by the need to analyze these types of datasets, we propose a nonlinear dimension reduction method, Spherical Rotation Component Analysis (SRCA), that incorporates geometric information to better approximate low-dimensional manifolds. SRCA is a versatile method designed to work in both high-dimensional and small sample size settings. By employing spheres or ellipsoids, SRCA provides a low-rank spherical representation of the data with general theoretic guarantees, effectively retaining the geometric structure of the dataset during dimensionality reduction. A comprehensive simulation study, along with a successful application to human cell cycle data, further highlights the advantages of SRCA compared to state-of-the-art alternatives, demonstrating its superior performance in approximating the manifold while preserving inherent geometric structures.


著者 Hengrui Luo,Jeremy E. Purvis,Didong Li
発行日 2023-04-27 15:47:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: 62R20, cs.LG, math.ST, stat.ME, stat.ML, stat.TH パーマリンク