要約
フローマッチングモデルは通常、線形挿入剤を使用して、順方向/ノイズの追加プロセスを定義します。
これは、ノイズとターゲット分布の間の独立した結合とともに、しばしば非ストレートであるベクトルフィールドを生成します。
このような湾曲したフィールドは、ゆっくりとした推論/生成プロセスにつながります。
この作業では、より速い生成を可能にするためにストレートベクトルフィールドを学習するために、柔軟な(潜在的に湾曲した)補間を学ぶことを提案します。
これをマルチレベルの最適化問題を介して定式化し、それを解決するための効率的な近似手順を提案します。
私たちのフレームワークは、エンドツーエンドおよびシミュレーションのない最適化手順を提供します。これは、直線生成軌跡を学習するために活用できます。
要約(オリジナル)
Flow matching models typically use linear interpolants to define the forward/noise addition process. This, together with the independent coupling between noise and target distributions, yields a vector field which is often non-straight. Such curved fields lead to a slow inference/generation process. In this work, we propose to learn flexible (potentially curved) interpolants in order to learn straight vector fields to enable faster generation. We formulate this via a multi-level optimization problem and propose an efficient approximate procedure to solve it. Our framework provides an end-to-end and simulation-free optimization procedure, which can be leveraged to learn straight line generative trajectories.
arxiv情報
著者 | Shiv Shankar,Tomas Geffner |
発行日 | 2025-03-26 16:54:56+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google