Manifold learning in Wasserstein space

要約

この論文は、Wasserstein-2 距離 $\mathrm{W} で計測された $\mathbb{R}^d$ のコンパクトな凸サブセット上の絶対連続確率測度の空間で多様体学習アルゴリズムの理論的基礎を構築することを目的としています。
$。
まず、$\Lambda$ に対する $W$ の測地線制限である計量 $\mathrm{W}_\Lambda$ を備えた確率測度の部分多様体 $\Lambda$ の構築を導入します。
他の構造とは対照的に、これらの部分多様体は必ずしも平坦ではありませんが、$\mathbb{R}^d$ のリーマン部分多様体と同様の方法で局所線形化が可能です。
次に、$(\Lambda,\mathrm{W}_{\Lambda})$ の潜在多様体構造が $\ のサンプル $\{\lambda_i\}_{i=1}^N$ からどのように学習できるかを示します。
Lambda$ とペアごとの外部 Wasserstein 距離 $\mathrm{W}$ のみ。
特に、計量空間 $(\Lambda,\mathrm{W}_{\Lambda})$ がノード $\{\lambda_i\} を持つグラフからグロモフ-ワッサーシュタインの意味で漸近的に復元できることを示します。
_{i=1}^N$ とエッジの重み $W(\lambda_i,\lambda_j)$。
さらに、$\lambda$ から十分に近くて多様なサンプル $\{\lambda_i までの最適な輸送マップを使用して、適切な「共分散演算子」のスペクトル分析によってサンプル $\lambda$ の接線空間を漸近的に回復する方法を示します。
\}_{i=1}^N$。
この論文は、部分多様体 $\Lambda$ のいくつかの明示的な構築と、スペクトル解析による接空間の回復に関する数値例で終わります。

要約(オリジナル)

This paper aims at building the theoretical foundations for manifold learning algorithms in the space of absolutely continuous probability measures on a compact and convex subset of $\mathbb{R}^d$, metrized with the Wasserstein-2 distance $\mathrm{W}$. We begin by introducing a construction of submanifolds $\Lambda$ of probability measures equipped with metric $\mathrm{W}_\Lambda$, the geodesic restriction of $W$ to $\Lambda$. In contrast to other constructions, these submanifolds are not necessarily flat, but still allow for local linearizations in a similar fashion to Riemannian submanifolds of $\mathbb{R}^d$. We then show how the latent manifold structure of $(\Lambda,\mathrm{W}_{\Lambda})$ can be learned from samples $\{\lambda_i\}_{i=1}^N$ of $\Lambda$ and pairwise extrinsic Wasserstein distances $\mathrm{W}$ only. In particular, we show that the metric space $(\Lambda,\mathrm{W}_{\Lambda})$ can be asymptotically recovered in the sense of Gromov–Wasserstein from a graph with nodes $\{\lambda_i\}_{i=1}^N$ and edge weights $W(\lambda_i,\lambda_j)$. In addition, we demonstrate how the tangent space at a sample $\lambda$ can be asymptotically recovered via spectral analysis of a suitable ‘covariance operator’ using optimal transport maps from $\lambda$ to sufficiently close and diverse samples $\{\lambda_i\}_{i=1}^N$. The paper closes with some explicit constructions of submanifolds $\Lambda$ and numerical examples on the recovery of tangent spaces through spectral analysis.

arxiv情報

著者 Keaton Hamm,Caroline Moosmüller,Bernhard Schmitzer,Matthew Thorpe
発行日 2024-07-31 12:10:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 41A65, 49Q22, 53Z50, 58B20, cs.LG, math.DG, stat.ML パーマリンク