Perception-Inspired Graph Convolution for Music Understanding Tasks

要約

我々は、MusGConv と呼ばれる新しいグラフ畳み込みブロックを提案します。これは、特に楽譜データの効率的な処理のために設計され、一般的な知覚原理に基づいて設計されています。
音楽の 2 つの基本的な側面、ピッチとリズムに焦点を当て、これらの要素の相対的表現と絶対的表現の両方を考慮します。
4 つの異なる音楽理解問題に対するアプローチを評価します。モノフォニック音声の分離、倍音分析、リズム検出、作曲家の識別です。これらは、抽象的には、さまざまなグラフ学習問題、つまりノード分類、リンク予測、グラフ分類に変換されます。
私たちの実験は、MusGConv が概念的に非常にシンプルで効率的であると同時に、前述の 3 つのタスクのパフォーマンスを向上させることを示しています。
私たちはこれを、楽譜データに対するグラフ ネットワーク アプリケーションを開発する際に、基本的な音楽概念の知覚に基づいた処理を含めることが有益であるという証拠として解釈します。

要約(オリジナル)

We propose a new graph convolutional block, called MusGConv, specifically designed for the efficient processing of musical score data and motivated by general perceptual principles. It focuses on two fundamental dimensions of music, pitch and rhythm, and considers both relative and absolute representations of these components. We evaluate our approach on four different musical understanding problems: monophonic voice separation, harmonic analysis, cadence detection, and composer identification which, in abstract terms, translate to different graph learning problems, namely, node classification, link prediction, and graph classification. Our experiments demonstrate that MusGConv improves the performance on three of the aforementioned tasks while being conceptually very simple and efficient. We interpret this as evidence that it is beneficial to include perception-informed processing of fundamental musical concepts when developing graph network applications on musical score data.

arxiv情報

著者 Emmanouil Karystinaios,Francesco Foscarin,Gerhard Widmer
発行日 2024-05-15 10:04:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.SD, eess.AS パーマリンク