要約
最近の技術の進歩により、一般大衆の間での画像生成の使用が普及しました。
ただし、効果的なプロンプトを作成することは、初心者ユーザーにとっては困難です。
この課題に取り組むために、ユーザーがセマンティックズームを使用して地図のようなビューを通して合成プロンプトの膨大なコレクションを自由に探索できるようにするテキスト間AIの新しいインタラクションスタイルであるProsptMapを開発しました。
プロンプトマップグループは、セマンティックな類似性によって視覚的に画像をグループ化し、ユーザーが関連する例を発見できるようにします。
被験者間のオンライン調査($ n = 60 $)および定性的な被験者内研究($ n = 12 $)でPromptMapを評価しました。
PromptMapは、例を提供することにより、プロンプトの作成をサポートしていることがわかりました。
また、LLMを使用して膨大な例コレクションを作成する可能性を実証しました。
私たちの仕事は、満足のいく画像出力を達成するために促すことに不慣れなユーザーをサポートする新しい相互作用スタイルに貢献しています。
要約(オリジナル)
Recent technological advances popularized the use of image generation among the general public. Crafting effective prompts can, however, be difficult for novice users. To tackle this challenge, we developed PromptMap, a new interaction style for text-to-image AI that allows users to freely explore a vast collection of synthetic prompts through a map-like view with semantic zoom. PromptMap groups images visually by their semantic similarity, allowing users to discover relevant examples. We evaluated PromptMap in a between-subject online study ($n=60$) and a qualitative within-subject study ($n=12$). We found that PromptMap supported users in crafting prompts by providing them with examples. We also demonstrated the feasibility of using LLMs to create vast example collections. Our work contributes a new interaction style that supports users unfamiliar with prompting in achieving a satisfactory image output.
arxiv情報
著者 | Krzysztof Adamkiewicz,Paweł W. Woźniak,Julia Dominiak,Andrzej Romanowski,Jakob Karolus,Stanislav Frolov |
発行日 | 2025-03-12 14:31:50+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google