Supervised Training of Conditional Monge Maps



– Optimal transport(OT)理論は、確率測度を別のものにマッピングするための最も効率的な方法を多数の選択肢から定義および選択する一般的な原則を説明します。
– この理論は、ソース測度とターゲット測度のペア(μ、ν)が与えられた場合、μをνに効率的にマッピングすることができるパラメータ付きのマップ Tθ を推定するために主に使用されます。
– しかし、細胞の治療への反応を予測するなどの多くの応用では、最適輸送問題を定義する入力/出力データ測定値のペア(μ、ν)が単独ではなく、コンテキスト(例えば、未処理と処理された細胞集団を比較するときの治療など)に関連付けられています。
– このようなコンテキストをOTの推定に考慮するために、著者らはCondOTを導入しています。CondOTは、複数の測定値のペア(μi、νi)を、コンテキストラベルc iでタグ付けし、コンテキスト変数に依存するOTマップファミリーを推定するためのマルチタスクアプローチです。
– CondOTは、データセット { (c i,(μi,νi)) }に含まれるすべてのラベル付きペアに適合するように期待されるコンテキスト条件付きのグローバルマップTTθを学習し、新しいコンテキストc newに依存する意味のあるマップTTθ(c new)を生成するように一般化することを目指します。
– 著者らのアプローチは部分入力凸ニューラルネットワークを利用しており、ガウス近似に着想を得た堅牢かつ効率的な初期化戦略を提供しています。
– 著者らは、この手法を用いて、単一細胞への遺伝子や治療の任意の組み合わせの影響を推論し、それらの影響を個別に観察するだけで測定しています。


Optimal transport (OT) theory describes general principles to define and select, among many possible choices, the most efficient way to map a probability measure onto another. That theory has been mostly used to estimate, given a pair of source and target probability measures $(\mu, \nu)$, a parameterized map $T_\theta$ that can efficiently map $\mu$ onto $\nu$. In many applications, such as predicting cell responses to treatments, pairs of input/output data measures $(\mu, \nu)$ that define optimal transport problems do not arise in isolation but are associated with a context $c$, as for instance a treatment when comparing populations of untreated and treated cells. To account for that context in OT estimation, we introduce CondOT, a multi-task approach to estimate a family of OT maps conditioned on a context variable, using several pairs of measures $\left(\mu_i, \nu_i\right)$ tagged with a context label $c_i$. CondOT learns a global map $\mathcal{T}_\theta$ conditioned on context that is not only expected to fit all labeled pairs in the dataset $\left\{\left(c_i,\left(\mu_i, \nu_i\right)\right)\right\}$, i.e., $\mathcal{T}_\theta\left(c_i\right) \sharp \mu_i \approx \nu_i$, but should also generalize to produce meaningful maps $\mathcal{T}_\theta\left(c_{\text {new }}\right)$ when conditioned on unseen contexts $c_{\text {new }}$. Our approach harnesses and provides a novel usage for partially input convex neural networks, for which we introduce a robust and efficient initialization strategy inspired by Gaussian approximations. We demonstrate the ability of CondOT to infer the effect of an arbitrary combination of genetic or therapeutic perturbations on single cells, using only observations of the effects of said perturbations separately.


著者 Charlotte Bunne,Andreas Krause,Marco Cuturi
発行日 2023-03-31 08:12:59+00:00
