要約
確率的最適制御や条件付き生成モデリングでは、中心的な計算タスクは、与えられた終端時間報酬を最大化するように参照拡散過程を修正することである。既存の手法の多くは、この報酬が微分可能であることを必要とし、勾配を用いて拡散を好ましい結果に導く。しかし、拡散ブリッジのような多くの実用的な設定では、報酬は特異であり、ターゲットにヒットすれば無限大の値をとり、そうでなければゼロとなる。我々は、このような特異な報酬に頑健な手法の開発を可能にする、マリアヴィン微積分と部分積分による経路空間積分に基づく新しいフレームワークを紹介する。これにより、本アプローチは、人工的な観測ノイズを必要とせずに、分類、拡散ブリッジ、コンディショニングなどの幅広い応用を扱うことができる。我々は、本アプローチが安定で信頼性の高い学習を提供し、既存の手法を凌駕することを実証する。
要約(オリジナル)
In stochastic optimal control and conditional generative modelling, a central computational task is to modify a reference diffusion process to maximise a given terminal-time reward. Most existing methods require this reward to be differentiable, using gradients to steer the diffusion towards favourable outcomes. However, in many practical settings, like diffusion bridges, the reward is singular, taking an infinite value if the target is hit and zero otherwise. We introduce a novel framework, based on Malliavin calculus and path-space integration by parts, that enables the development of methods robust to such singular rewards. This allows our approach to handle a broad range of applications, including classification, diffusion bridges, and conditioning without the need for artificial observational noise. We demonstrate that our approach offers stable and reliable training, outperforming existing techniques.
arxiv情報
著者 | Jakiw Pidstrigach,Elizabeth Baker,Carles Domingo-Enrich,George Deligiannidis,Nikolas Nüsken |
発行日 | 2025-04-04 14:10:21+00:00 |
arxivサイト | arxiv_id(pdf) |