要約
先行研究で作成されたラップ音楽のトランスクリプションに基づく新しいフリースタイル ラップ ソフトウェア、MCMChaos 0.0.1 を紹介します。
このソフトウェアには 3 つの異なるバージョンがあり、それぞれが異なる数学的シミュレーション手法 (コラプス ギブズ サンプラーとローレンツ アトラクター シミュレーション) を使用しています。
私たちが知る限り、これらのシミュレーション手法はこれまでラップ ミュージックの生成に使用されたことはありません。
このソフトウェアは、MCFlow コーパスからラングリングされたテキストを英語音声に変換する Python Text-to-Speech 処理 (pyttxs) を実装しています。
各バージョンでは、それぞれの数学モデルからシミュレートされた値によって、テキスト読み上げエンジンの音声速度、音量、および (複数音声の場合) 音声が行ごとに変更されます。
ソフトウェアのユーザーには、数学的シミュレーション手法に読み込まれた初期値を瞬時に変更するリアルタイムのグラフィカル ユーザー インターフェイス (GUI) が表示されます。
将来の研究では、ユーザーの制御と自律性をさらに高めることが試みられる可能性があります。
要約(オリジナル)
A novel freestyle rap software, MCMChaos 0.0.1, based on rap music transcriptions created in previous research is presented. The software has three different versions, each making use of different mathematical simulation methods: collapsed gibbs sampler and lorenz attractor simulation. As far as we know, these simulation methods have never been used in rap music generation before. The software implements Python Text-to-Speech processing (pyttxs) to convert text wrangled from the MCFlow corpus into English speech. In each version, values simulated from each respective mathematical model alter the rate of speech, volume, and (in the multiple voice case) the voice of the text-to-speech engine on a line-by-line basis. The user of the software is presented with a real-time graphical user interface (GUI) which instantaneously changes the initial values read into the mathematical simulation methods. Future research might attempt to allow for more user control and autonomy.
arxiv情報
著者 | Robert G. Kimelman |
発行日 | 2024-01-15 21:10:19+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google