要約
音楽作曲は人類の創造的な側面を表しており、それ自体が長い依存関係とハーモニーの制約のある情報を理解し生成する能力を必要とする複雑な作業です。
現在の LLM は、STEM 科目では優れた能力を発揮しますが、この課題では簡単に失敗し、コンテキスト学習や思考連鎖などの最新の技術を備えている場合でも、不適切な音楽を生成します。
LLM の推論能力と、音楽史と理論に関する大規模な知識ベースを活用して、音楽作曲における LLM の可能性をさらに探求し、強化するために、エージェントベースのシンボリック音楽生成フレームワークである ComposerX を提案します。
マルチエージェントアプローチを適用すると、GPT-4 の音楽作曲の品質が大幅に向上することがわかりました。
この結果は、ComposerX がユーザーの指示に従いながら、魅力的なメロディーを持つ一貫したポリフォニック音楽作品を作成できることを示しています。
要約(オリジナル)
Music composition represents the creative side of humanity, and itself is a complex task that requires abilities to understand and generate information with long dependency and harmony constraints. While demonstrating impressive capabilities in STEM subjects, current LLMs easily fail in this task, generating ill-written music even when equipped with modern techniques like In-Context-Learning and Chain-of-Thoughts. To further explore and enhance LLMs’ potential in music composition by leveraging their reasoning ability and the large knowledge base in music history and theory, we propose ComposerX, an agent-based symbolic music generation framework. We find that applying a multi-agent approach significantly improves the music composition quality of GPT-4. The results demonstrate that ComposerX is capable of producing coherent polyphonic music compositions with captivating melodies, while adhering to user instructions.
arxiv情報
著者 | Qixin Deng,Qikai Yang,Ruibin Yuan,Yipeng Huang,Yi Wang,Xubo Liu,Zeyue Tian,Jiahao Pan,Ge Zhang,Hanfeng Lin,Yizhi Li,Yinghao Ma,Jie Fu,Chenghua Lin,Emmanouil Benetos,Wenwu Wang,Guangyu Xia,Wei Xue,Yike Guo |
発行日 | 2024-04-30 14:14:26+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google