Benchmarks and leaderboards for sound demixing tasks

要約

音楽デミックスとは、与えられた単一のオーディオ信号から、ドラム、ベース、ボーカルとその他の伴奏などの構成要素に異なるトラックを分離する作業である。音源の分離は、エンターテイメントや補聴器など、様々な分野で有用です。本論文では、音源分離タスクのための2つの新しいベンチマークを紹介し、これらのベンチマークでサウンドデミキシングのための一般的なモデル、およびそれらのアンサンブルを比較する。モデルの評価については、https://mvsep.com/quality_checker/、リーダーボードを提供し、様々なモデルの比較を行う。新しいベンチマークデータセットは、ダウンロード可能です。また、特定のステムに最適な異なるモデルのアンサンブルに基づく、オーディオ分離のための新しいアプローチも開発した。提案するソリューションは、Music Demixing Challenge 2023の文脈で評価され、チャレンジの異なるトラックで上位の結果を達成しました。コードとアプローチはGitHubでオープンソース化されています。

要約(オリジナル)

Music demixing is the task of separating different tracks from the given single audio signal into components, such as drums, bass, and vocals from the rest of the accompaniment. Separation of sources is useful for a range of areas, including entertainment and hearing aids. In this paper, we introduce two new benchmarks for the sound source separation tasks and compare popular models for sound demixing, as well as their ensembles, on these benchmarks. For the models’ assessments, we provide the leaderboard at https://mvsep.com/quality_checker/, giving a comparison for a range of models. The new benchmark datasets are available for download. We also develop a novel approach for audio separation, based on the ensembling of different models that are suited best for the particular stem. The proposed solution was evaluated in the context of the Music Demixing Challenge 2023 and achieved top results in different tracks of the challenge. The code and the approach are open-sourced on GitHub.

arxiv情報

著者 Roman Solovyev,Alexander Stempkovskiy,Tatiana Habruseva
発行日 2023-05-12 14:00:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, cs.SD, eess.AS パーマリンク