DLT: Conditioned layout generation with Joint Discrete-Continuous Diffusion Layout Transformer


ビジュアル レイアウトの生成は、グラフィック デザインの重要な要素です。
ただし、離散 (クラス) 属性と連続 (位置、サイズ) 属性の混合で構成されるレイアウトの自然な表現に拡散モデルを適用する方法は不明です。
コンディショニング レイアウト生成の問題に対処するために、離散連続拡散モデルである DLT を導入します。
DLT は、すべてのレイアウト コンポーネント クラス、場所、およびサイズの任意のサブセットを条件付けできる柔軟な条件付けメカニズムを備えた、トランスフォーマー ベースのモデルです。


Generating visual layouts is an essential ingredient of graphic design. The ability to condition layout generation on a partial subset of component attributes is critical to real-world applications that involve user interaction. Recently, diffusion models have demonstrated high-quality generative performances in various domains. However, it is unclear how to apply diffusion models to the natural representation of layouts which consists of a mix of discrete (class) and continuous (location, size) attributes. To address the conditioning layout generation problem, we introduce DLT, a joint discrete-continuous diffusion model. DLT is a transformer-based model which has a flexible conditioning mechanism that allows for conditioning on any given subset of all the layout component classes, locations, and sizes. Our method outperforms state-of-the-art generative models on various layout generation datasets with respect to different metrics and conditioning settings. Additionally, we validate the effectiveness of our proposed conditioning mechanism and the joint continuous-diffusion process. This joint process can be incorporated into a wide range of mixed discrete-continuous generative tasks.


著者 Elad Levi,Eli Brosh,Mykola Mykhailych,Meir Perez
発行日 2023-03-07 09:30:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク