PosterCraft: Rethinking High-Quality Aesthetic Poster Generation in a Unified Framework

要約

美的ポスターを生成することは、シンプルなデザイン画像よりも困難です。正確なテキストレンダリングだけでなく、抽象的な芸術コンテンツ、印象的なレイアウト、全体的なスタイルの調和のシームレスな統合も必要です。
これに対処するために、事前のモジュラーパイプラインと剛性のある事前定義されたレイアウトを放棄する統合されたフレームワークであるPostercraftを提案し、モデルがコヒーレントで視覚的に魅力的な組成を自由に探索できるようにします。
PosterCraftは、慎重に設計されたカスケードされたワークフローを採​​用して、高美術ポスターの生成を最適化します。
(ii)HQ-poster100kで微調整された地域を認識した監視。
(iii)Best-of-n fearpence Optimizationによる美的テキストの補強学習。
(iv)共同ビジョン言語フィードバックの洗練。
各段階は、特定のニーズに合わせた完全に自動化されたデータ構築パイプラインによってサポートされており、複雑なアーキテクチャの変更なしで堅牢なトレーニングを可能にします。
複数の実験で評価されたPostercraftは、SOTA商用システムの品質をレンダリング、レイアウトのコヒーレンス、および全体的な視覚的魅力のレンダリングにおいて、オープンソースのベースラインを大幅に上回ります。
私たちのコード、モデル、およびデータセットは、プロジェクトページhttps://ephemeral182.github.io/postercraftにあります。

要約(オリジナル)

Generating aesthetic posters is more challenging than simple design images: it requires not only precise text rendering but also the seamless integration of abstract artistic content, striking layouts, and overall stylistic harmony. To address this, we propose PosterCraft, a unified framework that abandons prior modular pipelines and rigid, predefined layouts, allowing the model to freely explore coherent, visually compelling compositions. PosterCraft employs a carefully designed, cascaded workflow to optimize the generation of high-aesthetic posters: (i) large-scale text-rendering optimization on our newly introduced Text-Render-2M dataset; (ii) region-aware supervised fine-tuning on HQ-Poster100K; (iii) aesthetic-text-reinforcement learning via best-of-n preference optimization; and (iv) joint vision-language feedback refinement. Each stage is supported by a fully automated data-construction pipeline tailored to its specific needs, enabling robust training without complex architectural modifications. Evaluated on multiple experiments, PosterCraft significantly outperforms open-source baselines in rendering accuracy, layout coherence, and overall visual appeal-approaching the quality of SOTA commercial systems. Our code, models, and datasets can be found in the Project page: https://ephemeral182.github.io/PosterCraft

arxiv情報

著者 SiXiang Chen,Jianyu Lai,Jialin Gao,Tian Ye,Haoyu Chen,Hengyu Shi,Shitong Shao,Yunlong Lin,Song Fei,Zhaohu Xing,Yeying Jin,Junfeng Luo,Xiaoming Wei,Lei Zhu
発行日 2025-06-12 14:28:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク