要約
大規模言語モデル (LLM) は、その生成機能のおかげで、創造的なプロセスにとって非常に貴重なツールとなっています。
これらのモデルは、何百、何千ものビジュアルおよびテキスト出力を生成する能力を備えており、創造的な取り組みに豊富なインスピレーションを提供します。
しかし、私たちは彼らの可能性を最大限に活用できているでしょうか?
私たちは、現在のインタラクションパラダイムは不十分であり、ユーザーが生成モデル内の広大な潜在的なデザイン空間を探索できるようにするのではなく、限られたアイデアのセットに迅速に収束する方向にユーザーを誘導していると主張します。
この制限に対処するために、ユーザーが多数の応答をシームレスに探索、評価、合成できる設計空間の構造化された生成を容易にするフレームワークを提案します。
私たちは、インタラクティブ システム Luminate の設計と開発、および 8 人のプロのライターによるユーザー スタディを通じて、このフレームワークの実現可能性と有用性を実証します。
私たちの取り組みは、クリエイティブなタスクで LLM と対話する方法を進歩させ、LLM のクリエイティブな可能性を活用する方法を導入しています。
要約(オリジナル)
Thanks to their generative capabilities, large language models (LLMs) have become an invaluable tool for creative processes. These models have the capacity to produce hundreds and thousands of visual and textual outputs, offering abundant inspiration for creative endeavors. But are we harnessing their full potential? We argue that current interaction paradigms fall short, guiding users towards rapid convergence on a limited set of ideas, rather than empowering them to explore the vast latent design space in generative models. To address this limitation, we propose a framework that facilitates the structured generation of design space in which users can seamlessly explore, evaluate, and synthesize a multitude of responses. We demonstrate the feasibility and usefulness of this framework through the design and development of an interactive system, Luminate, and a user study with 8 professional writers. Our work advances how we interact with LLMs for creative tasks, introducing a way to harness the creative potential of LLMs.
arxiv情報
著者 | Sangho Suh,Meng Chen,Bryan Min,Toby Jia-Jun Li,Haijun Xia |
発行日 | 2023-10-23 16:16:12+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google