要約
大規模な言語モデル(LLMS)は無数のタスクで優れていますが、創造性に苦しんでいます。
この論文では、LLMを構造化された表現と認知的に促した操作を結びつける新しいアプローチを紹介し、より創造的で多様なアイデアを生み出します。
創造性の概念は、表面的なトークンレベルのバリエーションを超えています。
むしろ、既存のアイデアの構造化された表現を明示的に再結合し、アルゴリズムがアイデアのより抽象的な状況を効果的に探求できるようにします。
私たちは、創造的なレシピを生成するモデルであるDishcoverを使用して、料理のドメインでのアプローチを実証します。
モデルの結果をGPT-4oの結果と比較する実験は、多様性が大きくなっています。
ドメインの専門家の評価は、ほとんど一貫した実現可能な料理の作品である私たちの出力が、斬新さの点でGPT-4oを大幅に上回り、したがって創造的な世代でそれを上回ることを明らかにしています。
私たちの仕事が、AIの構造化された創造性に関するさらなる研究を促すことを願っています。
要約(オリジナル)
Large Language Models (LLMs) excel at countless tasks, yet struggle with creativity. In this paper, we introduce a novel approach that couples LLMs with structured representations and cognitively inspired manipulations to generate more creative and diverse ideas. Our notion of creativity goes beyond superficial token-level variations; rather, we explicitly recombine structured representations of existing ideas, allowing our algorithm to effectively explore the more abstract landscape of ideas. We demonstrate our approach in the culinary domain with DishCOVER, a model that generates creative recipes. Experiments comparing our model’s results to those of GPT-4o show greater diversity. Domain expert evaluations reveal that our outputs, which are mostly coherent and feasible culinary creations, significantly surpass GPT-4o in terms of novelty, thus outperforming it in creative generation. We hope our work inspires further research into structured creativity in AI.
arxiv情報
著者 | Moran Mizrahi,Chen Shani,Gabriel Stanovsky,Dan Jurafsky,Dafna Shahaf |
発行日 | 2025-04-29 11:13:06+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google