A Character-Centric Creative Story Generation via Imagination

要約

創造的なストーリーの生成は、NLP 研究の長年の目標でした。
既存の方法論は、長く一貫したストーリーを生成することを目的としていますが、多様性とキャラクターの深さの点で人間の能力には大幅に及んでいません。
これに対処するために、CCI (Character-centric Creative story Generation via Imagination) と呼ばれる新しいストーリー生成フレームワークを導入します。
CCI は、創造的なストーリーを生成するための 2 つのモジュール、IG (Image-Guided Imagination) と MW (Multi-Writer モデル) を備えています。
IG モジュールでは、テキストから画像へのモデルを利用して、テキストのみのアプローチよりも斬新かつ具体的な方法で、キャラクター、背景、メインプロットなどの主要なストーリー要素の視覚的表現を作成します。
MW モジュールは、これらのストーリー要素を使用して複数の人物像の候補を生成し、物語に挿入するのに最適なものを選択することで、物語の豊かさと深みを高めます。
CCI によって生成されたストーリーとベースライン モデルを、統計分析、人間による評価、LLM 評価を通じて比較しました。
結果は、IG および MW モジュールがストーリーの創造性のさまざまな側面を大幅に向上させることを示しました。
さらに、私たちのフレームワークは、ユーザーとのインタラクティブなマルチモーダルストーリー生成を可能にし、文化発展における人間とLLMの統合の新たな可能性を切り開きます。
プロジェクトページ:https://www.2024cci.p-e.kr/

要約(オリジナル)

Creative story generation has long been a goal of NLP research. While existing methodologies have aimed to generate long and coherent stories, they fall significantly short of human capabilities in terms of diversity and character depth. To address this, we introduce a novel story generation framework called CCI (Character-centric Creative story generation via Imagination). CCI features two modules for creative story generation: IG (Image-Guided Imagination) and MW (Multi-Writer model). In the IG module, we utilize a text-to-image model to create visual representations of key story elements, such as characters, backgrounds, and main plots, in a more novel and concrete manner than text-only approaches. The MW module uses these story elements to generate multiple persona-description candidates and selects the best one to insert into the story, thereby enhancing the richness and depth of the narrative. We compared the stories generated by CCI and baseline models through statistical analysis, as well as human and LLM evaluations. The results showed that the IG and MW modules significantly improve various aspects of the stories’ creativity. Furthermore, our framework enables interactive multi-modal story generation with users, opening up new possibilities for human-LLM integration in cultural development. Project page : https://www.2024cci.p-e.kr/

arxiv情報

著者 Kyeongman Park,Minbeom Kim,Kyomin Jung
発行日 2024-12-13 11:50:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク