Expanding the Generative AI Design Space through Structured Prompting and Multimodal Interfaces

要約

テキストベースのプロンプトは、生成AIの主要な相互作用パラダイムのままですが、多くの場合、広告などのドメイン固有のコンテキストで創造的な目標を明確にするのに苦労している中小企業所有者(SBO)などの初心者ユーザーに摩擦を導入します。
英国の6つのSBOを使用した形成的研究を通じて、3つの重要な課題を特定します。プロンプトを通じてブランドの直観を表現するのが難しいこと、コンテンツ生成中およびコンテンツ生成後の細かい調整と改良の機会が限られていること、およびブランドの特異性を欠く一般的なコンテンツの頻繁な生産。
これに応じて、従来の迅速なインターフェイスを超えて初心者のデザイナーをサポートするように設計されたマルチモーダル生成AIツールであるACAI(AIの共同創造)を提示します。
ACAIは、ブランディング、オーディエンス、目標、およびインスピレーションボードの3つのパネルで構成される構造化された入力システムを備えています。
これらの入力により、ユーザーはブランド関連のコンテキストと視覚的な好みを伝えることができます。
この作業は、構造化されたインターフェイスがユーザー定義のコンテキストを前景にし、アラインメントを改善し、初心者のクリエイティブワークフローにおける共同作成制御を強化する方法を示すことにより、生成システムに関するHCI研究に貢献します。

要約(オリジナル)

Text-based prompting remains the predominant interaction paradigm in generative AI, yet it often introduces friction for novice users such as small business owners (SBOs), who struggle to articulate creative goals in domain-specific contexts like advertising. Through a formative study with six SBOs in the United Kingdom, we identify three key challenges: difficulties in expressing brand intuition through prompts, limited opportunities for fine-grained adjustment and refinement during and after content generation, and the frequent production of generic content that lacks brand specificity. In response, we present ACAI (AI Co-Creation for Advertising and Inspiration), a multimodal generative AI tool designed to support novice designers by moving beyond traditional prompt interfaces. ACAI features a structured input system composed of three panels: Branding, Audience and Goals, and the Inspiration Board. These inputs allow users to convey brand-relevant context and visual preferences. This work contributes to HCI research on generative systems by showing how structured interfaces can foreground user-defined context, improve alignment, and enhance co-creative control in novice creative workflows.

arxiv情報

著者 Nimisha Karnatak,Adrien Baranes,Rob Marchant,Huinan Zeng,Tríona Butler,Kristen Olson
発行日 2025-04-22 17:59:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.HC パーマリンク