要約
すべての経験レベルの歌手にとって、技術的なレパートリーを学ぶ際の最も困難な課題の1つは、パッサジオとその周辺での配置と声レジスタ(胸の声と頭の声の登録の通過)をナビゲートすることです。
特にポップミュージックでは、シングルアーティストがさまざまな音色とテクスチャを使用して望ましい品質を実現することができるため、シンガーが使用しているボーカル範囲内のボーカルレジスタを特定することは困難です。
このホワイトペーパーでは、メルスペクトグラム画像のテクスチャー特徴の分析を通じて、男性のポップミュージックの音声信号にボーカルレジスタを分類するための2つの方法を紹介します。
さらに、ボーカル分析ツールのこれらのモデルの実用的な統合について説明し、自動ボーカルレジスタ分析を略するAVRAと呼ばれる同時に開発されたソフトウェアを導入します。
提案された方法は、サポートベクターマシン(SVM)と畳み込みニューラルネットワーク(CNN)モデルの両方を介してボーカルレジスタの一貫した分類を達成しました。
要約(オリジナル)
For singers of all experience levels, one of the most daunting challenges in learning technical repertoire is navigating placement and vocal register in and around the passagio (passage between chest voice and head voice registers). Particularly in pop music, where a single artist may use a variety of timbre’s and textures to achieve a desired quality, it can be difficult to identify what vocal register within the vocal range a singer is using. This paper presents two methods for classifying vocal registers in an audio signal of male pop music through the analysis of textural features of mel-spectrogram images. Additionally, we will discuss the practical integration of these models for vocal analysis tools, and introduce a concurrently developed software called AVRA which stands for Automatic Vocal Register Analysis. Our proposed methods achieved consistent classification of vocal register through both Support Vector Machine (SVM) and Convolutional Neural Network (CNN) models, which supports the promise of more robust classification possibilities across more voice types and genres of singing.
arxiv情報
著者 | Alexander Kim,Charlotte Botha |
発行日 | 2025-05-16 15:41:28+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google