Recognizing Ornaments in Vocal Indian Art Music with Active Annotation

要約

多くの音楽の伝統にわたるメロディックな表現には、装飾、装飾、または微気変動が不可欠であり、パフォーマンスに深み、ニュアンス、感情的な影響を加えます。
歌声の声の装飾を認識することは、音楽の教育学、歌手の識別、ジャンル分類、および制御された歌声生成の潜在的なアプリケーションを備えたMiRの鍵です。
ただし、注釈付きのデータセットと専門的なモデリングアプローチの欠如は、この研究分野での進歩の大きな障害のままです。
この作業では、専門のミュージシャンがキュレーションするインドのクラシック音楽の録音を含む新しいデータセットであるr \ = aga onnamentation Detection(ROD)を紹介します。
データセットには、イベントベースのラベルとしてマークされた6つのボーカル装飾品用のカスタムヒューマンループツールを使用して注釈が付けられます。
このデータセットを使用して、深い時系列分析に基づいて装飾検出モデルを開発し、長いオーディオ録音のチャンク中に装飾境界を維持します。
ロッドデータセット内のさまざまな列車テスト構成を使用して実験を実施し、インドの古典的なコンサート録音の別の手動注釈付きデータセットでアプローチを評価します。
実験結果は、ベースラインCRNNよりも提案されたアプローチの優れたパフォーマンスをサポートしています。

要約(オリジナル)

Ornamentations, embellishments, or microtonal inflections are essential to melodic expression across many musical traditions, adding depth, nuance, and emotional impact to performances. Recognizing ornamentations in singing voices is key to MIR, with potential applications in music pedagogy, singer identification, genre classification, and controlled singing voice generation. However, the lack of annotated datasets and specialized modeling approaches remains a major obstacle for progress in this research area. In this work, we introduce R\=aga Ornamentation Detection (ROD), a novel dataset comprising Indian classical music recordings curated by expert musicians. The dataset is annotated using a custom Human-in-the-Loop tool for six vocal ornaments marked as event-based labels. Using this dataset, we develop an ornamentation detection model based on deep time-series analysis, preserving ornament boundaries during the chunking of long audio recordings. We conduct experiments using different train-test configurations within the ROD dataset and also evaluate our approach on a separate, manually annotated dataset of Indian classical concert recordings. Our experimental results support the superior performance of our proposed approach over the baseline CRNN.

arxiv情報

著者 Sumit Kumar,Parampreet Singh,Vipul Arora
発行日 2025-05-07 13:52:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, eess.AS パーマリンク