要約
本稿では、音楽生成のための4つの異なる人工知能アルゴリズムを紹介し、生成された音楽の美的品質だけでなく、特定の用途への適合性に基づいてこれらの方法を比較することを目的とする。最初のメロディー・セットは、言語モデルとして使用される視覚変換ニューラルネットワークを少し修正したものによって生成される。2つ目のメロディーセットは、チャットソニフィケーションと古典的なトランスフォーマーニューラルネットワークを組み合わせて生成され(音楽生成の同じ方法は、以前の研究で発表されている)、3つ目のメロディーセットは、シリンジャーリズム理論と古典的なトランスフォーマーニューラルネットワークを組み合わせて生成され、4つ目のメロディーセットは、OpenAIによって提供されるGPT3トランスフォーマーを使用して生成される。これらのアプローチによって生成されたメロディーを比較分析した結果、それらの間には大きな違いが観察され、美的価値に関しては、GPT3が最も心地よいメロディーを生成し、新しく導入されたSchillinger法は、これまでの音波化手法よりも良い響きの音楽を生成することが証明された。
要約(オリジナル)
This paper introduces four different artificial intelligence algorithms for music generation and aims to compare these methods not only based on the aesthetic quality of the generated music but also on their suitability for specific applications. The first set of melodies is produced by a slightly modified visual transformer neural network that is used as a language model. The second set of melodies is generated by combining chat sonification with a classic transformer neural network (the same method of music generation is presented in a previous research), the third set of melodies is generated by combining the Schillinger rhythm theory together with a classic transformer neural network, and the fourth set of melodies is generated using GPT3 transformer provided by OpenAI. A comparative analysis is performed on the melodies generated by these approaches and the results indicate that significant differences can be observed between them and regarding the aesthetic value of them, GPT3 produced the most pleasing melodies, and the newly introduced Schillinger method proved to generate better sounding music than previous sonification methods.
arxiv情報
| 著者 | Razvan Paroiu,Stefan Trausan-Matu |
| 発行日 | 2025-04-03 13:51:07+00:00 |
| arxivサイト | arxiv_id(pdf) |