Training Free Guided Flow Matching with Optimal Control

要約

事前トレーニングされた拡散モデルとフローマッチングモデルを使用した制御された生成には、幅広い用途があります。
ODE ベースの生成モデルを導く 1 つの戦略は、以前の分布に近づけながら目標損失 $R(x_1)$ を最適化することです。
これに沿って、いくつかの最近の研究では、ODE サンプリング プロセスを通じて差別化することでフロー モデルをガイドすることの有効性が示されました。
優れたパフォーマンスにもかかわらず、この一連の方法の理論的理解はまだ予備段階であり、アルゴリズムを改善する余地が残されています。
さらに、既存の手法は主にユークリッド データ多様体に焦点を当てており、SO(3) などの複雑な形状に対するガイド付きフロー手法の切実なニーズがあり、これはタンパク質設計などのリスクの高い科学的アプリケーションで普及しています。
我々は、最適な制御を使用したガイド付きフローマッチングのための、一般的で理論に基づいたトレーニング不要のフレームワークである OC-Flow を紹介します。
最適制御理論の進歩に基づいて、誘導 ODE ベースの生成で最適制御を解決するための効果的かつ実用的なアルゴリズムを開発し、ユークリッドと SO(3) の両方における収束保証の体系的な理論分析を提供します。
既存の backprop-through-ODE メソッドがユークリッド OC-Flow の特殊なケースとして解釈できることを示します。
OC-Flow は、テキストガイドによる画像操作、条件付き分子生成、および全原子ペプチド設計に関する広範な実験で優れたパフォーマンスを達成しました。

要約(オリジナル)

Controlled generation with pre-trained Diffusion and Flow Matching models has vast applications. One strategy for guiding ODE-based generative models is through optimizing a target loss $R(x_1)$ while staying close to the prior distribution. Along this line, some recent work showed the effectiveness of guiding flow model by differentiating through its ODE sampling process. Despite the superior performance, the theoretical understanding of this line of methods is still preliminary, leaving space for algorithm improvement. Moreover, existing methods predominately focus on Euclidean data manifold, and there is a compelling need for guided flow methods on complex geometries such as SO(3), which prevails in high-stake scientific applications like protein design. We present OC-Flow, a general and theoretically grounded training-free framework for guided flow matching using optimal control. Building upon advances in optimal control theory, we develop effective and practical algorithms for solving optimal control in guided ODE-based generation and provide a systematic theoretical analysis of the convergence guarantee in both Euclidean and SO(3). We show that existing backprop-through-ODE methods can be interpreted as special cases of Euclidean OC-Flow. OC-Flow achieved superior performance in extensive experiments on text-guided image manipulation, conditional molecule generation, and all-atom peptide design.

arxiv情報

著者 Luran Wang,Chaoran Cheng,Yizhen Liao,Yanru Qu,Ge Liu
発行日 2024-12-12 17:23:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク