Unbalanced Optimal Transport meets Sliced-Wasserstein


最適輸送 (OT) は、多くの統計および機械学習の問題における基本的なタスクである確率測定を比較するための強力なフレームワークとして登場しました。
過去 10 年間で、計算的および統計的により効率的、または比較する測定値やデータセットに対してより堅牢な OT バリアントの設計において大幅な進歩が見られました。
その中でも、スライスされた OT 距離は、最適トランスポートの 3 次アルゴリズムの複雑さと次元の呪いを軽減するために広く使用されています。
並行して、アンバランス OT は、外れ値に対してより堅牢でありながら、より一般的な肯定的な尺度の比較を可能にするように設計されました。
このホワイトペーパーでは、これら 2 つの概念、つまりスライシングとアンバランス OT を組み合わせて、ポジティブな対策を効率的に比較するための一般的なフレームワークを開発することを提案します。
不均衡な OT をスライスするという考えに基づいて 2 つの新しい損失関数を提案し、それらの誘起トポロジーと統計的特性を研究します。
次に、これらの損失関数を計算するための高速の Frank-Wolfe 型アルゴリズムを開発し、結果として得られる方法論が以前の関連研究を包含および拡張するためモジュール式であることを示します。


Optimal transport (OT) has emerged as a powerful framework to compare probability measures, a fundamental task in many statistical and machine learning problems. Substantial advances have been made over the last decade in designing OT variants which are either computationally and statistically more efficient, or more robust to the measures and datasets to compare. Among them, sliced OT distances have been extensively used to mitigate optimal transport’s cubic algorithmic complexity and curse of dimensionality. In parallel, unbalanced OT was designed to allow comparisons of more general positive measures, while being more robust to outliers. In this paper, we propose to combine these two concepts, namely slicing and unbalanced OT, to develop a general framework for efficiently comparing positive measures. We propose two new loss functions based on the idea of slicing unbalanced OT, and study their induced topology and statistical properties. We then develop a fast Frank-Wolfe-type algorithm to compute these loss functions, and show that the resulting methodology is modular as it encompasses and extends prior related work. We finally conduct an empirical analysis of our loss functions and methodology on both synthetic and real datasets, to illustrate their relevance and applicability.


著者 Thibault Séjourné,Clément Bonet,Kilian Fatras,Kimia Nadjahi,Nicolas Courty
発行日 2023-06-12 15:15:00+00:00
カテゴリー: cs.LG, math.OC パーマリンク