Guided Flows for Generative Modeling and Decision Making

要約

分類子を使用しないガイダンスは、さまざまなタスクにわたって条件付き生成モデルのパフォーマンスを向上させるための重要なコンポーネントです。
これまでにサンプル品質の顕著な改善が実証されてきましたが、拡散モデルのみにのみ採用されていました。
この論文では、回帰ベクトル場に基づいて連続正規化フロー (CNF) をトレーニングするシミュレーション不要の代替アプローチであるフロー マッチング (FM) モデルに、分類子を使用しないガイダンスを統合します。
さまざまなダウンストリーム アプリケーションでの \emph{ガイド付きフロー} の使用法を検討します。
ガイド付きフローが条件付き画像生成とゼロショットテキスト音声合成のサンプル品質を大幅に向上させ、最先端のパフォーマンスを誇ることを示します。
特に、オフライン強化学習設定での計画生成にフロー モデルを初めて適用し、同等のパフォーマンスを維持しながら、拡散モデルと比較して 10 倍の計算速度の向上を示しました。

要約(オリジナル)

Classifier-free guidance is a key component for enhancing the performance of conditional generative models across diverse tasks. While it has previously demonstrated remarkable improvements for the sample quality, it has only been exclusively employed for diffusion models. In this paper, we integrate classifier-free guidance into Flow Matching (FM) models, an alternative simulation-free approach that trains Continuous Normalizing Flows (CNFs) based on regressing vector fields. We explore the usage of \emph{Guided Flows} for a variety of downstream applications. We show that Guided Flows significantly improves the sample quality in conditional image generation and zero-shot text-to-speech synthesis, boasting state-of-the-art performance. Notably, we are the first to apply flow models for plan generation in the offline reinforcement learning setting, showcasing a 10x speedup in computation compared to diffusion models while maintaining comparable performance.

arxiv情報

著者 Qinqing Zheng,Matt Le,Neta Shaul,Yaron Lipman,Aditya Grover,Ricky T. Q. Chen
発行日 2023-12-07 20:49:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO, stat.ML パーマリンク