要約
我々は、SDXL に基づいた 1 ステップ/数ステップの 1024px テキストから画像への生成で新しい最先端技術を実現する拡散蒸留法を提案します。
当社のメソッドは、プログレッシブ蒸留と敵対的蒸留を組み合わせて、品質とモード カバレッジのバランスを実現します。
この論文では、理論的分析、識別器の設計、モデルの定式化、およびトレーニング手法について説明します。
私たちは、抽出された SDXL-Lightning モデルを、LoRA および完全な UNet ウェイトの両方としてオープンソースにしています。
要約(オリジナル)
We propose a diffusion distillation method that achieves new state-of-the-art in one-step/few-step 1024px text-to-image generation based on SDXL. Our method combines progressive and adversarial distillation to achieve a balance between quality and mode coverage. In this paper, we discuss the theoretical analysis, discriminator design, model formulation, and training techniques. We open-source our distilled SDXL-Lightning models both as LoRA and full UNet weights.
arxiv情報
著者 | Shanchuan Lin,Anran Wang,Xiao Yang |
発行日 | 2024-02-26 06:51:39+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google