The Cultivated Practices of Text-to-Image Generation

要約

人類は、生成人工知能(AI)を使って誰でもデジタル情報を合成できる、斬新な創造的時代に突入している。特にテキストから画像への生成は大きな人気を博し、何百万人もの実践者がAI生成画像やAIアートをオンラインで制作している。本章ではまず、テキストから画像への生成にまつわる健全な共創的オンライン・エコシステムの急速な出現を可能にした主要な開発について概観し、続いてこのエコシステムにおける主要な要素について高レベルで説明する。特に、AIアート・コミュニティに受け入れられてきた創造的実践であるプロンプト・エンジニアリングに焦点を当てる。そして、出現しつつある共創的なエコシステムは、それ自体が知的なシステムであり、人間の創造性をサポートすると同時に、将来の世代を閉じ込め、AIにおける将来の開発努力を制限する可能性のあるシステムであることを論じる。この章では、今日のトレーニングデータに内在するバイアス、合成データが一般的になることによる将来の画像生成システムにおける潜在的な品質劣化、テキストから画像への生成が人々の想像力、野心、発達に及ぼす潜在的な長期的影響など、この共創的エコシステムを育成することの潜在的なリスクと危険性について議論する。

要約(オリジナル)

Humankind is entering a novel creative era in which anybody can synthesize digital information using generative artificial intelligence (AI). Text-to-image generation, in particular, has become vastly popular and millions of practitioners produce AI-generated images and AI art online. This chapter first gives an overview of the key developments that enabled a healthy co-creative online ecosystem around text-to-image generation to rapidly emerge, followed by a high-level description of key elements in this ecosystem. A particular focus is placed on prompt engineering, a creative practice that has been embraced by the AI art community. It is then argued that the emerging co-creative ecosystem constitutes an intelligent system on its own – a system that both supports human creativity, but also potentially entraps future generations and limits future development efforts in AI. The chapter discusses the potential risks and dangers of cultivating this co-creative ecosystem, such as the bias inherent in today’s training data, potential quality degradation in future image generation systems due to synthetic data becoming common place, and the potential long-term effects of text-to-image generation on people’s imagination, ambitions, and development.

arxiv情報

著者 Jonas Oppenlaender
発行日 2024-09-02 15:34:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CY, I.2.0 パーマリンク