要約
音楽データセットは、音楽の機械学習の研究を進める上で重要な役割を果たします。
ただし、既存の音楽データセットには、サイズの制限、アクセスのしやすさ、およびオーディオ リソースの不足という問題があります。
これらの欠点に対処するために、我々は、これまでに利用可能な最大の音楽データセットを一桁上回る、斬新で広範な音楽データセットである DISCO-10M を紹介します。
高品質のデータを保証するために、多段階のフィルタリング プロセスを実装しています。
このプロセスには、テキストの説明と音声の埋め込みに基づいた類似点が組み込まれます。
さらに、DISCO-10M とともに事前計算された CLAP 埋め込みを提供し、さまざまな下流タスクへの直接適用を容易にします。
これらの埋め込みにより、提供されたデータに対する機械学習アプリケーションの効率的な探索が可能になります。
DISCO-10M では、新しい研究を民主化して促進し、音楽用の新しい機械学習モデルの開発を促進することを目指しています。
要約(オリジナル)
Music datasets play a crucial role in advancing research in machine learning for music. However, existing music datasets suffer from limited size, accessibility, and lack of audio resources. To address these shortcomings, we present DISCO-10M, a novel and extensive music dataset that surpasses the largest previously available music dataset by an order of magnitude. To ensure high-quality data, we implement a multi-stage filtering process. This process incorporates similarities based on textual descriptions and audio embeddings. Moreover, we provide precomputed CLAP embeddings alongside DISCO-10M, facilitating direct application on various downstream tasks. These embeddings enable efficient exploration of machine learning applications on the provided data. With DISCO-10M, we aim to democratize and facilitate new research to help advance the development of novel machine learning models for music.
arxiv情報
著者 | Luca A. Lanzendörfer,Florian Grötschla,Emil Funke,Roger Wattenhofer |
発行日 | 2023-06-23 14:27:14+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google