Symbolic Music Structure Analysis with Graph Representations and Changepoint Detection Methods

要約

音楽構造分析は、音楽情報検索 (MIR) における公開研究課題です。
過去に、音楽をオーディオ ドメインとシンボリック ドメインに分割しようとする研究がいくつかありましたが、さまざまなレベルでの音楽構造の識別と分割は、この分野ではまだ未解決の研究課題です。
この作業では、3 つの方法を提案します。そのうちの 2 つは、象徴的な音楽をその形式または構造によってセグメント化することを目的とした新しいグラフベースのアルゴリズムです: Norm、G-PELT、および G-Window。
パラメータ値を変化させ、異なる音楽スタイルに対するパフォーマンスを比較する方法を比較するために、異なる形式または構造を持つ 2 つの公開データセットを使用してアブレーション研究を実行しました。
シンボリック音楽をグラフ表現でエンコードし、グラフから取得した隣接行列のノベルティを計算すると、シンボリック音楽作品の構造を、そこから特徴を抽出する必要なくうまく表現できることがわかりました。
私たちの方法をテストするために使用した公開データセットの 1 つで、1 つのバーの許容範囲に対して 0.5640 の F_1 を持つオンラインの教師なし変化点検出方法で境界を検出することができます。
また、レベルに応じて提案された方法のパラメーターをどのように調整する必要があるかを示すために、構造のさまざまなレベル (高、中、低) でのアルゴリズムのパフォーマンス結果も提供します。
この作業の再現性と使いやすさを容易にするために、各構造レベルのパラメーターを備えた最高のパフォーマンスのメソッドを、オープンソースの python パッケージである musicaiz に追加しました。
この方法を使用して、構造を伴う音楽生成、音楽分類、またはキー変更検出などの他の MIR タスクを改善できることを願っています。

要約(オリジナル)

Music Structure Analysis is an open research task in Music Information Retrieval (MIR). In the past, there have been several works that attempt to segment music into the audio and symbolic domains, however, the identification and segmentation of the music structure at different levels is still an open research problem in this area. In this work we propose three methods, two of which are novel graph-based algorithms that aim to segment symbolic music by its form or structure: Norm, G-PELT and G-Window. We performed an ablation study with two public datasets that have different forms or structures in order to compare such methods varying their parameter values and comparing the performance against different music styles. We have found that encoding symbolic music with graph representations and computing the novelty of Adjacency Matrices obtained from graphs represent the structure of symbolic music pieces well without the need to extract features from it. We are able to detect the boundaries with an online unsupervised changepoint detection method with a F_1 of 0.5640 for a 1 bar tolerance in one of the public datasets that we used for testing our methods. We also provide the performance results of the algorithms at different levels of structure, high, medium and low, to show how the parameters of the proposed methods have to be adjusted depending on the level. We added the best performing method with its parameters for each structure level to musicaiz, an open source python package, to facilitate the reproducibility and usability of this work. We hope that this methods could be used to improve other MIR tasks such as music generation with structure, music classification or key changes detection.

arxiv情報

著者 Carlos Hernandez-Olivan,Sonia Rubio Llamas,Jose R. Beltran
発行日 2023-03-24 09:45:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.SD, eess.AS パーマリンク