Predicting Music Hierarchies with a Graph-Based Neural Decoder

要約

この論文では、音楽シーケンスを依存関係ツリーに解析するためのデータ駆動型フレームワークについて説明します。依存関係ツリーは、音楽認知研究や音楽分析で使用される階層構造です。
解析には 2 つのステップが含まれます。
まず、入力シーケンスがトランスフォーマー エンコーダーに渡されて、コンテキスト情報が強化されます。
次に、分類子は、考えられるすべての依存関係アークのグラフをフィルター処理して、依存関係ツリーを生成します。
このシステムの大きな利点の 1 つは、最新の深層学習パイプラインに簡単に統合できることです。
さらに、特定の記号文法に依存しないため、複数の音楽的特徴を同時に考慮し、連続したコンテキスト情報を利用して、ノイズの多い入力に対して部分的な結果を生成できます。
私たちは音楽ツリーの 2 つのデータセット (単音の音符シーケンスのタイムスパン ツリーとジャズ コード シーケンスの倍音ツリー) でアプローチをテストし、私たちのアプローチが以前の方法よりも優れていることを示します。

要約(オリジナル)

This paper describes a data-driven framework to parse musical sequences into dependency trees, which are hierarchical structures used in music cognition research and music analysis. The parsing involves two steps. First, the input sequence is passed through a transformer encoder to enrich it with contextual information. Then, a classifier filters the graph of all possible dependency arcs to produce the dependency tree. One major benefit of this system is that it can be easily integrated into modern deep-learning pipelines. Moreover, since it does not rely on any particular symbolic grammar, it can consider multiple musical features simultaneously, make use of sequential context information, and produce partial results for noisy inputs. We test our approach on two datasets of musical trees — time-span trees of monophonic note sequences and harmonic trees of jazz chord sequences — and show that our approach outperforms previous methods.

arxiv情報

著者 Francesco Foscarin,Daniel Harasim,Gerhard Widmer
発行日 2023-06-29 13:59:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.SD, eess.AS パーマリンク