Analysis of Classifier-Free Guidance Weight Schedulers


Classifier-Free Guide (CFG) は、テキストから画像への拡散モデルの品質と条件の遵守を強化します。
このペーパーでは、包括的な実験を実施することにより、CFG 重み付けスケジューラーについての洞察を提供します。
私たちの調査結果は、シンプルで単調に増加する重みスケジューラーが、わずか 1 行のコードを必要とし、一貫してパフォーマンスの向上につながることを示唆しています。


Classifier-Free Guidance (CFG) enhances the quality and condition adherence of text-to-image diffusion models. It operates by combining the conditional and unconditional predictions using a fixed weight. However, recent works vary the weights throughout the diffusion process, reporting superior results but without providing any rationale or analysis. By conducting comprehensive experiments, this paper provides insights into CFG weight schedulers. Our findings suggest that simple, monotonically increasing weight schedulers consistently lead to improved performances, requiring merely a single line of code. In addition, more complex parametrized schedulers can be optimized for further improvement, but do not generalize across different models and tasks.


著者 Xi Wang,Nicolas Dufour,Nefeli Andreou,Marie-Paule Cani,Victoria Fernandez Abrevaya,David Picard,Vicky Kalogeiton
発行日 2024-04-19 17:53:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV, cs.LG パーマリンク