Bellman Optimal Stepsize Straightening of Flow-Matching Models

要約

フロー マッチングは、さまざまなアプリケーション、特に画像合成で高品質のサンプルを生成するための強力なフレームワークです。
ただし、これらのモデルでは、特に微調整プロセスやサンプリング プロセス中に大量の計算要求が発生するため、リソースが少ないシナリオでは重大な課題が生じます。
この論文では、フローマッチング生成モデルを抽出するための Bellman Optimal Stepsize Straightening (BOSS) 手法を紹介します。この手法は、計算予算の制約を遵守しながら、数ステップで効率的な画像サンプリングを特に目的としています。
まず、この手法には、事前学習されたネットワークのステップサイズを最適化する動的プログラミング アルゴリズムが含まれます。
次に、最適なステップ サイズに一致するように速度ネットワークを調整し、生成パスを直線化することを目指します。
画像生成タスクにわたる広範な実験評価により、リソース使用率と画像品質の両方の観点から BOSS の有効性が実証されています。
私たちの結果は、BOSS が競争力のあるサンプル品質を維持しながら効率の大幅な向上を達成し、低リソースの制約とフローマッチング生成モデルの厳しい要件の間のギャップを効果的に橋渡ししていることを明らかにしています。
私たちの論文はまた、人工知能の責任ある開発を強化し、計算コストと環境フットプリントを削減する、より持続可能な生成モデルを提供します。
私たちのコードは https://github.com/nguyenngocbaocmt02/BOSS にあります。

要約(オリジナル)

Flow matching is a powerful framework for generating high-quality samples in various applications, especially image synthesis. However, the intensive computational demands of these models, especially during the finetuning process and sampling processes, pose significant challenges for low-resource scenarios. This paper introduces Bellman Optimal Stepsize Straightening (BOSS) technique for distilling flow-matching generative models: it aims specifically for a few-step efficient image sampling while adhering to a computational budget constraint. First, this technique involves a dynamic programming algorithm that optimizes the stepsizes of the pretrained network. Then, it refines the velocity network to match the optimal step sizes, aiming to straighten the generation paths. Extensive experimental evaluations across image generation tasks demonstrate the efficacy of BOSS in terms of both resource utilization and image quality. Our results reveal that BOSS achieves substantial gains in efficiency while maintaining competitive sample quality, effectively bridging the gap between low-resource constraints and the demanding requirements of flow-matching generative models. Our paper also fortifies the responsible development of artificial intelligence, offering a more sustainable generative model that reduces computational costs and environmental footprints. Our code can be found at https://github.com/nguyenngocbaocmt02/BOSS.

arxiv情報

著者 Bao Nguyen,Binh Nguyen,Viet Anh Nguyen
発行日 2024-02-20 14:25:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク