The Art of Storytelling: Multi-Agent Generative AI for Dynamic Multimodal Narratives


この論文では、子供向けのストーリーテリングを強化するために生成人工知能 (GenAI) を利用する教育ツールの概念を紹介します。
このシステムは、GenAI 主導のナラティブの共同作成、テキストから音声への変換、およびテキストからビデオへの生成を組み合わせて、学習者にとって魅力的な体験を生み出します。


This paper introduces the concept of an education tool that utilizes Generative Artificial Intelligence (GenAI) to enhance storytelling for children. The system combines GenAI-driven narrative co-creation, text-to-speech conversion, and text-to-video generation to produce an engaging experience for learners. We describe the co-creation process, the adaptation of narratives into spoken words using text-to-speech models, and the transformation of these narratives into contextually relevant visuals through text-to-video technology. Our evaluation covers the linguistics of the generated stories, the text-to-speech conversion quality, and the accuracy of the generated visuals.


著者 Samee Arif,Taimoor Arif,Aamina Jamal Khan,Muhammad Saad Haroon,Agha Ali Raza,Awais Athar
発行日 2024-09-17 15:10:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CL パーマリンク