Consistent Optimal Transport with Empirical Conditional Measures

要約

2 つの結合分布からのサンプルが与えられた場合、共通の変数で条件付けされた場合のそれらの間の最適輸送 (OT) の問題を検討します。
条件付き変数が連続的であり、2 つの結合分布におけるこの変数の周辺が同じではない可能性がある一般的な設定に焦点を当てます。
このような設定では、標準的な OT バリアントを使用することはできず、新しい推定手法が必要になります。
主な課題は、条件付き分布が明示的に利用できないことであるため、OT 定式化における重要なアイデアは、結合サンプルに対して計算されたカーネル化最小二乗項を使用することです。これにより、輸送計画の限界と経験的な条件が暗黙的に一致します。
穏やかな条件下では、推定された輸送計画が条件付き変数の関数として漸近的に最適であることが証明されます。
有限サンプルの場合、正規化された目的に関する偏差は $O(1/m^{1/4})$ によって制限されることを示します ($m$ はサンプル数)。
また、明示的な確率モデルと暗黙的な生成モデルを使用して条件付き輸送計画をモデル化する方法についても説明します。
最適な計画が分析的にわかっている場合、合成データセットに対する推定量の一貫性を経験的に検証します。
治療に対する細胞反応を予測するという文脈で、少数ショット分類のための即時学習や条件付き生成などのアプリケーションに使用すると、当社の方法論は最先端の方法を改善します。

要約(オリジナル)

Given samples from two joint distributions, we consider the problem of Optimal Transportation (OT) between them when conditioned on a common variable. We focus on the general setting where the conditioned variable may be continuous, and the marginals of this variable in the two joint distributions may not be the same. In such settings, standard OT variants cannot be employed, and novel estimation techniques are necessary. Since the main challenge is that the conditional distributions are not explicitly available, the key idea in our OT formulation is to employ kernelized-least-squares terms computed over the joint samples, which implicitly match the transport plan’s marginals with the empirical conditionals. Under mild conditions, we prove that our estimated transport plans, as a function of the conditioned variable, are asymptotically optimal. For finite samples, we show that the deviation in terms of our regularized objective is bounded by $O(1/m^{1/4})$, where $m$ is the number of samples. We also discuss how the conditional transport plan could be modelled using explicit probabilistic models as well as using implicit generative ones. We empirically verify the consistency of our estimator on synthetic datasets, where the optimal plan is analytically known. When employed in applications like prompt learning for few-shot classification and conditional-generation in the context of predicting cell responses to treatment, our methodology improves upon state-of-the-art methods.

arxiv情報

著者 Piyushi Manupriya,Rachit Keerti Das,Sayantan Biswas,Saketha Nath Jagarlapudi
発行日 2024-01-24 14:13:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク