要約
MetaDesigner は、ラージ言語モデル (LLM) の強みを活用して、ユーザー エンゲージメントを中心としたデザイン パラダイムを推進することにより、芸術的なタイポグラフィー合成に革命をもたらします。
このフレームワークの中核には、パイプライン エージェント、グリフ エージェント、テクスチャ エージェントで構成されるマルチエージェント システムがあり、セマンティックの強化から複雑なテクスチャの面付けに至るまで、カスタマイズされたワードアートを共同で作成できます。
MetaDesigner には、マルチモーダル モデルとユーザー評価からの洞察を活用して、設計プロセスを繰り返し改良および強化する包括的なフィードバック メカニズムが組み込まれています。
このフィードバック ループを通じて、システムはユーザー定義のスタイルやテーマの好みに合わせてハイパーパラメーターを適切に調整し、視覚的な魅力やコンテキストの関連性に対するユーザーの期待を満たすだけでなく、それを超えるワードアートを生成します。
実証的な検証により、多様なワードアート アプリケーションを効果的に提供し、美的に魅力的でコンテキストに応じた結果を一貫して生成する MetaDesigner の機能が強調されます。
要約(オリジナル)
MetaDesigner revolutionizes artistic typography synthesis by leveraging the strengths of Large Language Models (LLMs) to drive a design paradigm centered around user engagement. At the core of this framework lies a multi-agent system comprising the Pipeline, Glyph, and Texture agents, which collectively enable the creation of customized WordArt, ranging from semantic enhancements to the imposition of complex textures. MetaDesigner incorporates a comprehensive feedback mechanism that harnesses insights from multimodal models and user evaluations to refine and enhance the design process iteratively. Through this feedback loop, the system adeptly tunes hyperparameters to align with user-defined stylistic and thematic preferences, generating WordArt that not only meets but exceeds user expectations of visual appeal and contextual relevance. Empirical validations highlight MetaDesigner’s capability to effectively serve diverse WordArt applications, consistently producing aesthetically appealing and context-sensitive results.
arxiv情報
著者 | Jun-Yan He,Zhi-Qi Cheng,Chenyang Li,Jingdong Sun,Qi He,Wangmeng Xiang,Hanyuan Chen,Jin-Peng Lan,Xianhui Lin,Kang Zhu,Bin Luo,Yifeng Geng,Xuansong Xie,Alexander G. Hauptmann |
発行日 | 2024-06-28 11:58:26+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google