Bellman Optimal Step-size Straightening of Flow-Matching Models

要約

フロー マッチングは、さまざまなアプリケーション、特に画像合成で高品質のサンプルを生成するための強力なフレームワークです。
ただし、これらのモデルでは、特に微調整プロセスやサンプリング プロセス中に大量の計算要求が発生するため、リソースが少ないシナリオでは重大な課題が生じます。
この論文では、フローマッチング生成モデルを抽出するための Bellman Optimal Step-size Straightening (BOSS) 手法を紹介します。特に、計算予算の制約を遵守しながら、数ステップの効率的な画像サンプリングを目的としています。
まず、この手法には、事前学習されたネットワークのステップ サイズを最適化する動的プログラミング アルゴリズムが含まれます。
次に、最適なステップ サイズに一致するように速度ネットワークを調整し、生成パスを直線化することを目指します。
画像生成タスクにわたる広範な実験評価により、リソース使用率と画像品質の両方の観点から BOSS の有効性が実証されています。
私たちの結果は、BOSS が競争力のあるサンプル品質を維持しながら効率の大幅な向上を達成し、低リソースの制約とフローマッチング生成モデルの厳しい要件の間のギャップを効果的に橋渡ししていることを明らかにしています。
私たちの論文はまた、人工知能の責任ある開発を強化し、計算コストと環境フットプリントを削減する、より持続可能な生成モデルを提供します。
私たちのコードは https://github.com/nguyenngocbaocmt02/BOSS にあります。

要約(オリジナル)

Flow matching is a powerful framework for generating high-quality samples in various applications, especially image synthesis. However, the intensive computational demands of these models, especially during the fine-tuning process and sampling processes, pose significant challenges for low-resource scenarios. This paper introduces Bellman Optimal Step-size Straightening (BOSS) technique for distilling flow-matching generative models: it aims specifically for a few-step efficient image sampling while adhering to a computational budget constraint. First, this technique involves a dynamic programming algorithm that optimizes the step sizes of the pretrained network. Then, it refines the velocity network to match the optimal step sizes, aiming to straighten the generation paths. Extensive experimental evaluations across image generation tasks demonstrate the efficacy of BOSS in terms of both resource utilization and image quality. Our results reveal that BOSS achieves substantial gains in efficiency while maintaining competitive sample quality, effectively bridging the gap between low-resource constraints and the demanding requirements of flow-matching generative models. Our paper also fortifies the responsible development of artificial intelligence, offering a more sustainable generative model that reduces computational costs and environmental footprints. Our code can be found at https://github.com/nguyenngocbaocmt02/BOSS.

arxiv情報

著者 Bao Nguyen,Binh Nguyen,Viet Anh Nguyen
発行日 2024-01-10 10:34:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク