要約
芸術的なスタイルは何世紀にもわたって研究されてきましたが、機械学習の最近の進歩は、計算的にそれを理解するための新しい可能性を生み出しています。
しかし、機械学習モデルが実践者や批評家の利益と一致する洞察を生み出すことを保証することは、依然として重要な課題です。
ここでは、豊かな理論的および数学的分析の伝統の恩恵を受ける音楽スタイルに焦点を当てています。
さまざまな監視済み学習モデルをトレーニングして、84時間の録音の慎重にキュレーションされたデータセットで20人の象徴的なジャズミュージシャンを特定し、意思決定プロセスを解釈します。
私たちのモデルには、4つの音楽ドメイン(メロディー、ハーモニー、リズム、ダイナミクス)を個別に分析できる新しいマルチ入力アーキテクチャが含まれています。
これらのモデルにより、音楽理論の基本的な質問に対処し、音楽パフォーマーの識別(20のクラスで94%の精度)を前進させることができます。
モデルのオープンソースの実装と、音楽スタイルを探索するための付随するWebアプリケーションをリリースします。
要約(オリジナル)
Artistic style has been studied for centuries, and recent advances in machine learning create new possibilities for understanding it computationally. However, ensuring that machine-learning models produce insights aligned with the interests of practitioners and critics remains a significant challenge. Here, we focus on musical style, which benefits from a rich theoretical and mathematical analysis tradition. We train a variety of supervised-learning models to identify 20 iconic jazz musicians across a carefully curated dataset of 84 hours of recordings, and interpret their decision-making processes. Our models include a novel multi-input architecture that enables four musical domains (melody, harmony, rhythm, and dynamics) to be analysed separately. These models enable us to address fundamental questions in music theory and also advance the state-of-the-art in music performer identification (94% accuracy across 20 classes). We release open-source implementations of our models and an accompanying web application for exploring musical styles.
arxiv情報
著者 | Huw Cheston,Reuben Bance,Peter M. C. Harrison |
発行日 | 2025-05-14 15:56:36+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google