Synthesis and Analysis of Data as Probability Measures with Entropy-Regularized Optimal Transport


エントロピー正則化された Wasserstein-2 コストとその不偏バージョンであるシンクホーン発散を使用した確率測度の合成と分析を検討します。
合成問題は、$m$ 次元シンプレックスに属する一連の係数が与えられた場合に、$m$ 参照測度のこれらのコストに関して重心を計算することで構成されます。
解析問題は、Wasserstein-2 距離内で指定された測定値 $\mu$ に最も近い重心の係数を見つけることで構成されます。
これまでの文献に記載されている尺度に関する最も弱い仮定の下で、エントロピー正規化された Wasserstein-2 コストの導関数を計算します。
これを利用して、重心から参照測度までのエントロピー マップの平均に対する固定小数点方程式の解として、正規化された重心の特性評価を確立します。
この特徴付けにより、$\mu$ が重心である場合の解析問題を解くための有限次元の凸二次プログラムが得られます。
また、重心座標が Wasserstein-2 計量の摂動に対して安定していることも確立し、これらの係数が破損に対して堅牢であることを示唆しています。
破損した点群データを分類するための特徴として重心係数を採用し、ニューラル ネットワークのベースラインと比較して、小規模なトレーニング データ領域ではこのアプローチがより効率的であることを示します。


We consider synthesis and analysis of probability measures using the entropy-regularized Wasserstein-2 cost and its unbiased version, the Sinkhorn divergence. The synthesis problem consists of computing the barycenter, with respect to these costs, of $m$ reference measures given a set of coefficients belonging to the $m$-dimensional simplex. The analysis problem consists of finding the coefficients for the closest barycenter in the Wasserstein-2 distance to a given measure $\mu$. Under the weakest assumptions on the measures thus far in the literature, we compute the derivative of the entropy-regularized Wasserstein-2 cost. We leverage this to establish a characterization of regularized barycenters as solutions to a fixed-point equation for the average of the entropic maps from the barycenter to the reference measures. This characterization yields a finite-dimensional, convex, quadratic program for solving the analysis problem when $\mu$ is a barycenter. It is shown that these coordinates, as well as the value of the barycenter functional, can be estimated from samples with dimension-independent rates of convergence, a hallmark of entropy-regularized optimal transport, and we verify these rates experimentally. We also establish that barycentric coordinates are stable with respect to perturbations in the Wasserstein-2 metric, suggesting a robustness of these coefficients to corruptions. We employ the barycentric coefficients as features for classification of corrupted point cloud data, and show that compared to neural network baselines, our approach is more efficient in small training data regimes.


著者 Brendan Mallery,James M. Murphy,Shuchin Aeron
発行日 2025-01-14 09:17:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.LG, stat.ML パーマリンク