LLM-based multi-agent poetry generation in non-cooperative environments

要約

自動詩生成のための大規模言語モデル (LLM) は大幅に進歩しているにもかかわらず、生成される詩には多様性が欠けており、トレーニング プロセスは人間の学習とは大きく異なります。
詩生成システムの学習プロセスはより人間らしく、その出力はより多様で斬新であるべきであるという理論的根拠に基づいて、多様性を促進するために協力的な相互作用に加えて非協力的な相互作用を強調する社会学習に基づくフレームワークを導入します。
私たちの実験は、トレーニングベースのエージェント (GPT-2) とプロンプトベースのエージェント (GPT-3 および GPT-4) の両方を使用して詩を生成するための、非協力的な環境における LLM ベースのマルチエージェント システムの最初の試みです。
96,000 個の生成された詩に基づく評価では、私たちのフレームワークがトレーニングベースのエージェントの詩生成プロセスに利益をもたらし、その結果、1) 多様性が 3.0 ~ 3.7 パーセント ポイント (pp) 増加し、新規性が 5.6 ~ 11.3 pp 増加しました。
新しい N グラム。
トレーニングベースのエージェントから生成された詩も、語彙、スタイル、意味論の点でグループの相違を示しています。
私たちのフレームワークにおけるプロンプトベースのエージェントは非協力的な環境からも恩恵を受けており、非均質なエージェントを含むより多様なモデルのアンサンブルは多様性をさらに強化する可能性があり、実験によれば 7.0 ~ 17.5 pp 増加します。
ただし、プロンプトベースのエージェントは時間の経過とともに語彙の多様性が減少し、ソーシャル ネットワークで意図されているグループベースの相違を示しません。
私たちの論文は、詩の自動生成などの創造的なタスクに、人間の対話と同様の社会学習プロセス (LLM ベースのエージェント モデリングによる) を組み込むパラダイム シフトを主張しています。

要約(オリジナル)

Despite substantial progress of large language models (LLMs) for automatic poetry generation, the generated poetry lacks diversity while the training process differs greatly from human learning. Under the rationale that the learning process of the poetry generation systems should be more human-like and their output more diverse and novel, we introduce a framework based on social learning where we emphasize non-cooperative interactions besides cooperative interactions to encourage diversity. Our experiments are the first attempt at LLM-based multi-agent systems in non-cooperative environments for poetry generation employing both TRAINING-BASED agents (GPT-2) and PROMPTING-BASED agents (GPT-3 and GPT-4). Our evaluation based on 96k generated poems shows that our framework benefits the poetry generation process for TRAINING-BASED agents resulting in 1) a 3.0-3.7 percentage point (pp) increase in diversity and a 5.6-11.3 pp increase in novelty according to distinct and novel n-grams. The generated poetry from TRAINING-BASED agents also exhibits group divergence in terms of lexicons, styles and semantics. PROMPTING-BASED agents in our framework also benefit from non-cooperative environments and a more diverse ensemble of models with non-homogeneous agents has the potential to further enhance diversity, with an increase of 7.0-17.5 pp according to our experiments. However, PROMPTING-BASED agents show a decrease in lexical diversity over time and do not exhibit the group-based divergence intended in the social network. Our paper argues for a paradigm shift in creative tasks such as automatic poetry generation to include social learning processes (via LLM-based agent modeling) similar to human interaction.

arxiv情報

著者 Ran Zhang,Steffen Eger
発行日 2024-09-05 16:12:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク