The Cultivated Practices of Text-to-Image Generation


特にテキストから画像への生成は非常に普及しており、何百万人もの実践者が AI 生成画像や AI アートをオンラインで制作しています。
この章ではまず、テキストから画像への生成を中心とした健全な共同創造オンライン エコシステムの急速な出現を可能にした主要な開発の概要を説明し、続いてこのエコシステムの主要な要素の概要を説明します。
AI アート コミュニティで採用されている創造的な実践であるプロンプト エンジニアリングに特に重点が置かれています。
そして、新興の共創エコシステムはそれ自体でインテリジェントなシステムを構成しており、このシステムは人間の創造性をサポートするだけでなく、潜在的に将来の世代を捕らえ、将来の AI 開発努力を制限するシステムであると主張されています。
この章では、今日のトレーニング データに内在するバイアス、合成データが一般的になることによる将来の画像生成システムにおける潜在的な品質低下、および潜在的な長期的な影響など、この共創エコシステムの育成に伴う潜在的なリスクと危険性について説明します。


Humankind is entering a novel creative era in which anybody can synthesize digital information using generative artificial intelligence (AI). Text-to-image generation, in particular, has become vastly popular and millions of practitioners produce AI-generated images and AI art online. This chapter first gives an overview of the key developments that enabled a healthy co-creative online ecosystem around text-to-image generation to rapidly emerge, followed by a high-level description of key elements in this ecosystem. A particular focus is placed on prompt engineering, a creative practice that has been embraced by the AI art community. It is then argued that the emerging co-creative ecosystem constitutes an intelligent system on its own – a system that both supports human creativity, but also potentially entraps future generations and limits future development efforts in AI. The chapter discusses the potential risks and dangers of cultivating this co-creative ecosystem, such as the bias inherent in today’s training data, potential quality degradation in future image generation systems due to synthetic data becoming common place, and the potential long-term effects of text-to-image generation on people’s imagination, ambitions, and development.


著者 Jonas Oppenlaender
発行日 2024-08-05 08:28:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CY, I.2.0 パーマリンク