LayoutDM: Discrete Diffusion Model for Controllable Layout Generation

要約

制御可能なレイアウト生成は、特定の要素のタイプや位置などのオプションの制約を使用して、要素の境界ボックスのもっともらしい配置を合成することを目的としています。
この作業では、離散状態空間拡散モデルに基づく単一のモデルで幅広いレイアウト生成タスクを解決しようとします。
LayoutDM という名前のモデルは、離散表現で構造化されたレイアウト データを自然に処理し、モダリティごとの離散拡散によってレイアウト破損プロセスをモデル化する初期入力からノイズのないレイアウトを段階的に推測することを学習します。
条件付き生成では、推論中にマスキングまたはロジット調整の形でレイアウト制約を挿入することを提案します。
実験では、LayoutDM が高品質のレイアウトを正常に生成し、いくつかのレイアウト タスクでタスク固有のベースラインとタスクに依存しないベースラインの両方を上回ることを示しています。

要約(オリジナル)

Controllable layout generation aims at synthesizing plausible arrangement of element bounding boxes with optional constraints, such as type or position of a specific element. In this work, we try to solve a broad range of layout generation tasks in a single model that is based on discrete state-space diffusion models. Our model, named LayoutDM, naturally handles the structured layout data in the discrete representation and learns to progressively infer a noiseless layout from the initial input, where we model the layout corruption process by modality-wise discrete diffusion. For conditional generation, we propose to inject layout constraints in the form of masking or logit adjustment during inference. We show in the experiments that our LayoutDM successfully generates high-quality layouts and outperforms both task-specific and task-agnostic baselines on several layout tasks.

arxiv情報

著者 Naoto Inoue,Kotaro Kikuchi,Edgar Simo-Serra,Mayu Otani,Kota Yamaguchi
発行日 2023-03-14 17:59:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.GR パーマリンク