CreatiPoster: Towards Editable and Controllable Multi-Layer Graphic Design Generation

要約

グラフィックデザインは、商業的および個人的なコンテキストの両方で重要な役割を果たしますが、特に初心者にとっては、高品質で編集可能な、審美的に心地よいグラフィック構成を作成することは、時間がかかり、スキル集約的なタスクのままです。
現在のAIツールは、ワークフローの一部を自動化しますが、ユーザーが提供する資産を正確に組み込み、編集可能性を維持し、専門的な視覚的魅力を達成するのに苦労しています。
Canva Magic Designのような商用システムは、複製するのに非現実的な膨大なテンプレートライブラリに依存しています。
このペーパーでは、オプションの自然言語の指示または資産から編集可能な多層構成を生成するフレームワークであるCreatiposterを紹介します。
RGBAラージマルチモーダルモデルであるプロトコルモデルは、まず、正確なレイアウト、階層、コンテンツ、スタイルを備えたすべてのレイヤー(テキストまたは資産)を詳細に詳細にするJSON仕様を作成し、さらに簡潔なバックグラウンドプロンプトを作成します。
条件付きバックグラウンドモデルは、このレンダリングされた前景層に条件付けられたコヒーレントバックグラウンドを合成します。
グラフィックデザイン生成用の自動メトリックを使用してベンチマークを構築し、Creatiposterが主要なオープンソースアプローチと独自の商用システムを上回ることを示しています。
さらなる研究を触媒するために、100,000の多層設計の著作権のないコーパスをリリースします。
Creatiposterは、Canvasの編集、テキストオーバーレイ、レスポンシブサイズ変更、多言語適応、アニメーションポスターなどの多様なアプリケーションをサポートし、AI支援グラフィックデザインの民主化を進めています。
プロジェクトホームページ:https://github.com/graphic-design-ai/creatiposter

要約(オリジナル)

Graphic design plays a crucial role in both commercial and personal contexts, yet creating high-quality, editable, and aesthetically pleasing graphic compositions remains a time-consuming and skill-intensive task, especially for beginners. Current AI tools automate parts of the workflow, but struggle to accurately incorporate user-supplied assets, maintain editability, and achieve professional visual appeal. Commercial systems, like Canva Magic Design, rely on vast template libraries, which are impractical for replicate. In this paper, we introduce CreatiPoster, a framework that generates editable, multi-layer compositions from optional natural-language instructions or assets. A protocol model, an RGBA large multimodal model, first produces a JSON specification detailing every layer (text or asset) with precise layout, hierarchy, content and style, plus a concise background prompt. A conditional background model then synthesizes a coherent background conditioned on this rendered foreground layers. We construct a benchmark with automated metrics for graphic-design generation and show that CreatiPoster surpasses leading open-source approaches and proprietary commercial systems. To catalyze further research, we release a copyright-free corpus of 100,000 multi-layer designs. CreatiPoster supports diverse applications such as canvas editing, text overlay, responsive resizing, multilingual adaptation, and animated posters, advancing the democratization of AI-assisted graphic design. Project homepage: https://github.com/graphic-design-ai/creatiposter

arxiv情報

著者 Zhao Zhang,Yutao Cheng,Dexiang Hong,Maoke Yang,Gonglei Shi,Lei Ma,Hui Zhang,Jie Shao,Xinglong Wu
発行日 2025-06-12 16:54:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク