要約
シュルディンガー ブリッジ (最適な物質輸送の確率的動的一般化) は、学習と制御の二重性を示します。
確率的制御問題として見ると、シュディンガー ブリッジは、制御された拡散と期限の制約に従う総制御労力を最小限に抑えながら、特定の結合状態統計を別の結合状態統計に導く最適な制御ポリシーを見つけます。
確率的学習問題として見ると、Schr\'{o}dinger ブリッジは、エンドポイントの分布観測を接続する最も可能性の高い分布値の軌跡を見つけます。つまり、確率分布の多様体にわたる 2 点境界制約付きの最尤問題を解きます。
最近の研究では、状態コストを伴うシュディンガー ブリッジ問題を解くには、状態コストが状態依存の反応速度として現れる反応拡散偏微分方程式に関連するマルコフ カーネルを見つける必要があることが示されています。
量子力学におけるワイル微積分のアイデア、特にワイル演算子とワイル記号が、そのようなマルコフ カーネルを決定するのにどのように役立つかを説明します。
ワイル計算を介して二次状態コストの場合のマルコフ カーネルを明示的に見つけ、以前の結果を復元しますが、エルミート多項式による退屈な計算を回避することで、これらのアイデアを説明します。
要約(オリジナル)
Schr\'{o}dinger bridge–a stochastic dynamical generalization of optimal mass transport–exhibits a learning-control duality. Viewed as a stochastic control problem, the Schr\'{o}dinger bridge finds an optimal control policy that steers a given joint state statistics to another while minimizing the total control effort subject to controlled diffusion and deadline constraints. Viewed as a stochastic learning problem, the Schr\'{o}dinger bridge finds the most-likely distribution-valued trajectory connecting endpoint distributional observations, i.e., solves the two point boundary-constrained maximum likelihood problem over the manifold of probability distributions. Recent works have shown that solving the Schr\'{o}dinger bridge problem with state cost requires finding the Markov kernel associated with a reaction-diffusion PDE where the state cost appears as a state-dependent reaction rate. We explain how ideas from Weyl calculus in quantum mechanics, specifically the Weyl operator and the Weyl symbol, can help determine such Markov kernels. We illustrate these ideas by explicitly finding the Markov kernel for the case of quadratic state cost via Weyl calculus, recovering our earlier results but avoiding tedious computation with Hermite polynomials.
arxiv情報
著者 | Alexis M. H. Teter,Wenqing Wang,Abhishek Halder |
発行日 | 2024-07-26 15:48:23+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google