要約
ピクセル完璧な精度でフォトリアリスティックな画像コンテンツを生成できる拡散モデル ファミリである Edify Image を紹介します。
Edify Image は、新しいラプラシアン拡散プロセスを使用してトレーニングされたカスケード ピクセル空間拡散モデルを利用します。このプロセスでは、異なる周波数帯域の画像信号がさまざまなレートで減衰されます。
Edify Image は、テキストから画像への合成、4K アップサンプリング、ControlNet、360 HDR パノラマ生成、画像カスタマイズのための微調整など、幅広いアプリケーションをサポートしています。
要約(オリジナル)
We introduce Edify Image, a family of diffusion models capable of generating photorealistic image content with pixel-perfect accuracy. Edify Image utilizes cascaded pixel-space diffusion models trained using a novel Laplacian diffusion process, in which image signals at different frequency bands are attenuated at varying rates. Edify Image supports a wide range of applications, including text-to-image synthesis, 4K upsampling, ControlNets, 360 HDR panorama generation, and finetuning for image customization.
arxiv情報
著者 | NVIDIA,:,Yuval Atzmon,Maciej Bala,Yogesh Balaji,Tiffany Cai,Yin Cui,Jiaojiao Fan,Yunhao Ge,Siddharth Gururani,Jacob Huffman,Ronald Isaac,Pooya Jannaty,Tero Karras,Grace Lam,J. P. Lewis,Aaron Licata,Yen-Chen Lin,Ming-Yu Liu,Qianli Ma,Arun Mallya,Ashlee Martino-Tarr,Doug Mendez,Seungjun Nah,Chris Pruett,Fitsum Reda,Jiaming Song,Ting-Chun Wang,Fangyin Wei,Xiaohui Zeng,Yu Zeng,Qinsheng Zhang |
発行日 | 2024-11-11 16:58:31+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google