要約
ローマ数字分析は、調性音楽のコードとその機能的コンテキストを特定する重要なタスクです。
この論文では、象徴音楽におけるローマ数字の自動分析に対する新しいアプローチを紹介します。
既存の手法はスコアの中間非可逆表現に依存していますが、私たちは、スコア内の個々の音符の直接の記述と処理を可能にするグラフ ニューラル ネットワーク (GNN) に基づく新しい手法を提案します。
提案されたアーキテクチャは、ノートごとの特徴とノート間の相互依存性を活用できますが、新しいエッジ縮小アルゴリズムによってオンセットごとの表現が得られます。
私たちの結果は、ChordGNN が既存の最先端のモデルを上回っており、参照データセットのローマ数字分析でより高い精度を達成していることを示しています。
さらに、NADE などの提案された手法やコード予測の後処理を使用して、モデルのバリアントを調査します。
この作業の完全なソース コードは https://github.com/manoskary/chordgnn で入手できます。
要約(オリジナル)
Roman Numeral analysis is the important task of identifying chords and their functional context in pieces of tonal music. This paper presents a new approach to automatic Roman Numeral analysis in symbolic music. While existing techniques rely on an intermediate lossy representation of the score, we propose a new method based on Graph Neural Networks (GNNs) that enable the direct description and processing of each individual note in the score. The proposed architecture can leverage notewise features and interdependencies between notes but yield onset-wise representation by virtue of our novel edge contraction algorithm. Our results demonstrate that ChordGNN outperforms existing state-of-the-art models, achieving higher accuracy in Roman Numeral analysis on the reference datasets. In addition, we investigate variants of our model using proposed techniques such as NADE, and post-processing of the chord predictions. The full source code for this work is available at https://github.com/manoskary/chordgnn
arxiv情報
著者 | Emmanouil Karystinaios,Gerhard Widmer |
発行日 | 2023-07-07 12:20:56+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google