LayoutDM: Discrete Diffusion Model for Controllable Layout Generation


LayoutDM という名前のモデルは、離散表現で構造化されたレイアウト データを自然に処理し、モダリティごとの離散拡散によってレイアウト破損プロセスをモデル化する初期入力からノイズのないレイアウトを段階的に推測することを学習します。
実験では、LayoutDM が高品質のレイアウトを正常に生成し、いくつかのレイアウト タスクでタスク固有のベースラインとタスクに依存しないベースラインの両方を上回ることを示しています。


Controllable layout generation aims at synthesizing plausible arrangement of element bounding boxes with optional constraints, such as type or position of a specific element. In this work, we try to solve a broad range of layout generation tasks in a single model that is based on discrete state-space diffusion models. Our model, named LayoutDM, naturally handles the structured layout data in the discrete representation and learns to progressively infer a noiseless layout from the initial input, where we model the layout corruption process by modality-wise discrete diffusion. For conditional generation, we propose to inject layout constraints in the form of masking or logit adjustment during inference. We show in the experiments that our LayoutDM successfully generates high-quality layouts and outperforms both task-specific and task-agnostic baselines on several layout tasks.


著者 Naoto Inoue,Kotaro Kikuchi,Edgar Simo-Serra,Mayu Otani,Kota Yamaguchi
発行日 2023-03-14 17:59:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV, cs.GR パーマリンク