Unbalancedness in Neural Monge Maps Improves Unpaired Domain Translation

要約

最適トランスポート (OT) では、Monge マップは、最もコスト効率の高い方法でソース ディストリビューションをターゲット ディストリビューションにトランスポートするマッピングとして知られています。
最近、Monge マップ用の複数のニューラル推定器が開発され、さまざまな不対ドメイン翻訳タスクに適用されています。
単細胞生物学とコンピュータビジョンの分野。
ただし、古典的な OT フレームワークは大量保存を強制するため、外れ値が発生しやすく、現実世界のシナリオへの適用性が制限されます。
後者は、分布内のサンプルの相対位置が明示的に考慮される OT ドメイン変換タスクで特に有害となる可能性があります。
アンバランス OT は離散設定でこの課題に取り組んでいますが、ニューラル モンジュ マップ推定器への統合はあまり注目されていません。
我々は、モンジュマップ推定器に不均衡を組み込むための理論に基づいた方法を提案します。
既存の推定器を改良して、時間の経過に伴う細胞の軌跡をモデル化し、摂動に対する細胞の応答を予測します。
さらに、私たちのアプローチは OT フロー マッチング (OT-FM) フレームワークとシームレスに統合されています。
OT-FM が画像変換において競合的に機能することを示しますが、不均衡性 (UOT-FM) を組み込むことでパフォーマンスをさらに向上させ、関連する機能をより適切に保持します。
したがって、我々は、ペアのない画像変換のための原則的な方法として UOT-FM を確立します。

要約(オリジナル)

In optimal transport (OT), a Monge map is known as a mapping that transports a source distribution to a target distribution in the most cost-efficient way. Recently, multiple neural estimators for Monge maps have been developed and applied in diverse unpaired domain translation tasks, e.g. in single-cell biology and computer vision. However, the classic OT framework enforces mass conservation, which makes it prone to outliers and limits its applicability in real-world scenarios. The latter can be particularly harmful in OT domain translation tasks, where the relative position of a sample within a distribution is explicitly taken into account. While unbalanced OT tackles this challenge in the discrete setting, its integration into neural Monge map estimators has received limited attention. We propose a theoretically grounded method to incorporate unbalancedness into any Monge map estimator. We improve existing estimators to model cell trajectories over time and to predict cellular responses to perturbations. Moreover, our approach seamlessly integrates with the OT flow matching (OT-FM) framework. While we show that OT-FM performs competitively in image translation, we further improve performance by incorporating unbalancedness (UOT-FM), which better preserves relevant features. We hence establish UOT-FM as a principled method for unpaired image translation.

arxiv情報

著者 Luca Eyring,Dominik Klein,Théo Uscidda,Giovanni Palla,Niki Kilbertus,Zeynep Akata,Fabian Theis
発行日 2024-03-11 17:23:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク