要約
分類子を使用しないガイダンスは、多くの下流タスクの条件付き生成モデルのパフォーマンスを向上させるための重要なコンポーネントです。
生成されるサンプルの品質は大幅に向上しますが、これまでは拡散モデルにのみ使用されていました。
シミュレーション不要の代替アプローチであるフロー マッチング (FM) は、回帰ベクトル場に基づいて連続正規化フロー (CNF) をトレーニングします。
フロー マッチング モデルに対して分類子を使用しないガイダンスを実行できるかどうか、またそれによりパフォーマンスがどの程度向上するかは未解決の問題のままです。
このペーパーでは、条件付き画像生成、音声合成、強化学習を含むさまざまな下流アプリケーションでのガイド付きフローの使用法を検討します。
特に、オフライン強化学習設定にフロー モデルを適用したのは初めてです。
また、ガイド付きフローにより、画像生成とゼロショットテキスト音声合成のサンプル品質が大幅に向上し、エージェントの全体的なパフォーマンスに影響を与えることなく、大幅に少ない計算量で利用できることも示しました。
要約(オリジナル)
Classifier-free guidance is a key component for improving the performance of conditional generative models for many downstream tasks. It drastically improves the quality of samples produced, but has so far only been used for diffusion models. Flow Matching (FM), an alternative simulation-free approach, trains Continuous Normalizing Flows (CNFs) based on regressing vector fields. It remains an open question whether classifier-free guidance can be performed for Flow Matching models, and to what extent does it improve performance. In this paper, we explore the usage of Guided Flows for a variety of downstream applications involving conditional image generation, speech synthesis, and reinforcement learning. In particular, we are the first to apply flow models to the offline reinforcement learning setting. We also show that Guided Flows significantly improves the sample quality in image generation and zero-shot text-to-speech synthesis, and can make use of drastically low amounts of computation without affecting the agent’s overall performance.
arxiv情報
著者 | Qinqing Zheng,Matt Le,Neta Shaul,Yaron Lipman,Aditya Grover,Ricky T. Q. Chen |
発行日 | 2023-11-22 15:07:59+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google