Arabic Music Classification and Generation using Deep Learning

要約

この論文は、エジプトの古典音楽と新しい音楽を作曲家ごとに分類し、類似した新しい音楽を生成するための機械学習アプローチを提案します。
提案されたシステムは、分類に畳み込みニューラル ネットワーク (CNN) を利用し、生成に CNN オートエンコーダーを利用します。
このプロジェクトで使用されるデータセットは、さまざまな作曲家によって作曲された新しいエジプト音楽と古典的なエジプト音楽で構成されています。
音楽を作曲家ごとに分類するために、各サンプルは正規化され、メル スペクトログラムに変換されます。
CNN モデルは、メル スペクトログラムを入力特徴として、コンポーザー ラベルを出力クラスとして使用して、データセット上でトレーニングされます。
このモデルは、作曲家ごとに音楽を分類する際に 81.4\% の精度を達成し、提案されたアプローチの有効性を示しています。
元の曲に似た新しい音楽を生成するために、CNN オートエンコーダーが同様のデータセットでトレーニングされます。
このモデルは、元の部分のメル スペクトログラムを低次元の潜在空間にエンコードしてから、元のメル スペクトログラムにデコードするようにトレーニングされています。
生成された音楽は、潜在空間からサンプリングし、サンプルをメル スペクトログラムにデコードして戻し、その後オーディオに変換することによって生成されます。
結論として、提案されたシステムは、エジプトの古典音楽を分類および生成するための有望なアプローチを提供し、音楽推奨システム、音楽制作、音楽教育などのさまざまな音楽アプリケーションに適用できます。

要約(オリジナル)

This paper proposes a machine learning approach for classifying classical and new Egyptian music by composer and generating new similar music. The proposed system utilizes a convolutional neural network (CNN) for classification and a CNN autoencoder for generation. The dataset used in this project consists of new and classical Egyptian music pieces composed by different composers. To classify the music by composer, each sample is normalized and transformed into a mel spectrogram. The CNN model is trained on the dataset using the mel spectrograms as input features and the composer labels as output classes. The model achieves 81.4\% accuracy in classifying the music by composer, demonstrating the effectiveness of the proposed approach. To generate new music similar to the original pieces, a CNN autoencoder is trained on a similar dataset. The model is trained to encode the mel spectrograms of the original pieces into a lower-dimensional latent space and then decode them back into the original mel spectrogram. The generated music is produced by sampling from the latent space and decoding the samples back into mel spectrograms, which are then transformed into audio. In conclusion, the proposed system provides a promising approach to classifying and generating classical Egyptian music, which can be applied in various musical applications, such as music recommendation systems, music production, and music education.

arxiv情報

著者 Mohamed Elshaarawy,Ashrakat Saeed,Mariam Sheta,Abdelrahman Said,Asem Bakr,Omar Bahaa,Walid Gomaa
発行日 2024-10-25 17:47:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.SD, eess.AS パーマリンク