Geometry-Aware Generative Autoencoders for Warped Riemannian Metric Learning and Generative Modeling on Data Manifolds

要約

単一細胞 RNA シークエンシングや空間ゲノミクスなどの分野における高次元データセットの急速な成長により、科学的発見の前例のない機会がもたらされていますが、計算上および統計上特有の課題も生じています。
従来の方法では、ジオメトリを意識したデータ生成、意味のある軌跡に沿った補間、実行可能なパスを介した母集団の輸送に苦労しています。
これらの問題に対処するために、拡張可能な多様体学習と生成モデリングを組み合わせた新しいフレームワークである Geometry-Aware Generative Autoencoder (GAGA) を紹介します。
GAGA は、多様体学習によって発見された固有幾何学を尊重し、データ空間上で新しいワープ リーマン計量を学習するニューラル ネットワーク埋め込み空間を構築します。
このワープされたメトリックは、データ多様体上の点と多様体からの負のサンプルの両方から導出され、潜在空間全体にわたる意味のあるジオメトリを特徴付けることができます。
このメトリクスを使用して、GAGA は多様体上の点を均一にサンプリングし、測地線に沿って点を生成し、学習された多様体全体の母集団間を補間できます。
GAGA は、単一細胞集団レベルの軌道推論における最先端の手法と比べて 30% 向上するなど、シミュレートされたデータセットと現実世界のデータセットで競争力のあるパフォーマンスを示します。

要約(オリジナル)

Rapid growth of high-dimensional datasets in fields such as single-cell RNA sequencing and spatial genomics has led to unprecedented opportunities for scientific discovery, but it also presents unique computational and statistical challenges. Traditional methods struggle with geometry-aware data generation, interpolation along meaningful trajectories, and transporting populations via feasible paths. To address these issues, we introduce Geometry-Aware Generative Autoencoder (GAGA), a novel framework that combines extensible manifold learning with generative modeling. GAGA constructs a neural network embedding space that respects the intrinsic geometries discovered by manifold learning and learns a novel warped Riemannian metric on the data space. This warped metric is derived from both the points on the data manifold and negative samples off the manifold, allowing it to characterize a meaningful geometry across the entire latent space. Using this metric, GAGA can uniformly sample points on the manifold, generate points along geodesics, and interpolate between populations across the learned manifold. GAGA shows competitive performance in simulated and real world datasets, including a 30% improvement over the state-of-the-art methods in single-cell population-level trajectory inference.

arxiv情報

著者 Xingzhi Sun,Danqi Liao,Kincaid MacDonald,Yanlei Zhang,Chen Liu,Guillaume Huguet,Guy Wolf,Ian Adelstein,Tim G. J. Rudner,Smita Krishnaswamy
発行日 2024-10-16 17:53:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.DG, stat.ML パーマリンク