Promptify: Text-to-Image Generation through Interactive Prompt Exploration with Large Language Models

要約

タイトル:Promptify:大規模言語モデルを用いたインタラクティブなプロンプト探索によるテキストから画像生成

要約:

– テキストから画像を生成するモデルは、テキストから高品質の画像を生成することができることが示されている。
– しかし、ユーザーの創造的な意図を正確に捉えるプロンプトを作成することは難しい。
– もともとのプロンプトに潜在的な変更を提案することによって、Promptifyはユーザーをサポートし、プロンプトの探索と修正を行うためのインタラクティブなシステムである。
– Promptifyのインターフェイスは、生成された画像を柔軟に整理することができ、ユーザーの好みに基づいて元のプロンプトの潜在的な変更を提案する。
– フィードバックループにより、ユーザーは反復的にプロンプトを洗練させ、必要な特徴を強化し、望まない特徴を回避することができる。
– ユーザースタディによって、Promptifyはテキストから画像生成に広く使用されている既存のベースラインツールを上回る効果を発揮することが示された。

要約(オリジナル)

Text-to-image generative models have demonstrated remarkable capabilities in generating high-quality images based on textual prompts. However, crafting prompts that accurately capture the user’s creative intent remains challenging. It often involves laborious trial-and-error procedures to ensure that the model interprets the prompts in alignment with the user’s intention. To address the challenges, we present Promptify, an interactive system that supports prompt exploration and refinement for text-to-image generative models. Promptify utilizes a suggestion engine powered by large language models to help users quickly explore and craft diverse prompts. Our interface allows users to organize the generated images flexibly, and based on their preferences, Promptify suggests potential changes to the original prompt. This feedback loop enables users to iteratively refine their prompts and enhance desired features while avoiding unwanted ones. Our user study shows that Promptify effectively facilitates the text-to-image workflow and outperforms an existing baseline tool widely used for text-to-image generation.

arxiv情報

著者 Stephen Brade,Bryan Wang,Mauricio Sousa,Sageev Oore,Tovi Grossman
発行日 2023-04-18 22:59:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.HC, cs.MM パーマリンク