Soft-constrained Schrodinger Bridge: a Stochastic Control Approach

要約

シュディンガー ブリッジは、終端分布が事前に指定された目標分布と一致する、最適に制御された拡散プロセスを見つけることが目標である連続時間の確率制御問題とみなすことができます。
我々は、端末分布がターゲットと異なることを許容しつつ、2 つの分布間のカルバック・ライブラー発散にペナルティを与えることによって、この問題を一般化することを提案します。
この新しい制御問題をソフト制約付きシュディンガー ブリッジ (SSB) と呼びます。
この研究の主な貢献は、SSB に対する解の理論的導出であり、最適に制御されたプロセスの最終分布がターゲットと他の分布の幾何学的混合であることを示しています。
この結果はさらに時系列設定に拡張されます。
アプリケーションの 1 つは、堅牢な生成拡散モデルの開発です。
幾何学的混合物からサンプリングするためのスコア マッチング ベースのアルゴリズムを提案し、MNIST データ セットの数値例を通じてその使用法を紹介します。

要約(オリジナル)

Schr\'{o}dinger bridge can be viewed as a continuous-time stochastic control problem where the goal is to find an optimally controlled diffusion process whose terminal distribution coincides with a pre-specified target distribution. We propose to generalize this problem by allowing the terminal distribution to differ from the target but penalizing the Kullback-Leibler divergence between the two distributions. We call this new control problem soft-constrained Schr\'{o}dinger bridge (SSB). The main contribution of this work is a theoretical derivation of the solution to SSB, which shows that the terminal distribution of the optimally controlled process is a geometric mixture of the target and some other distribution. This result is further extended to a time series setting. One application is the development of robust generative diffusion models. We propose a score matching-based algorithm for sampling from geometric mixtures and showcase its use via a numerical example for the MNIST data set.

arxiv情報

著者 Jhanvi Garg,Xianyang Zhang,Quan Zhou
発行日 2024-04-22 17:50:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 60J60, 60J70, 93E20, cs.LG, math.OC, stat.CO, stat.ML パーマリンク