MIDI-to-Tab: Guitar Tablature Inference via Masked Language Modeling

要約

ギターのタブ譜は、特定のチューニングで各音をギターの弦とフレットに割り当て、楽器のどこで音を演奏するかを正確に示すことで、伝統的な楽譜の構造を豊かにします。
記号的な音楽表現からタブ譜を生成するという問題には、作曲または演奏全体にわたって音符ごとにこの弦とフレットの割り当てを推測することが含まれます。
ギターでは、ほとんどのピッチで複数の弦とフレットの割り当てが可能であるため、組み合わせのスペースが大きくなり、網羅的な検索アプローチが妨げられます。
最新の手法のほとんどは、制約ベースの動的プログラミングを使用して、一部のコスト関数 (手の位置の動きなど) を最小限に抑えます。
この研究では、記号的なギターのタブ譜を推定するための新しい深層学習ソリューションを紹介します。
マスクされた言語モデリング パラダイムでエンコーダー/デコーダー Transformer モデルをトレーニングし、文字列に音符を割り当てます。
モデルはまず、25,000 を超えるタブ譜のデータセットである DadaGP で事前トレーニングされ、次にプロが転写したギター演奏の厳選されたセットで微調整されます。
タブ譜の品質の評価には主観的な性質があるため、私たちはギタリストを対象としたユーザー調査を実施し、参加者に同じ 4 小節の抜粋に対する複数のバージョンのタブ譜の演奏のしやすさを評価してもらいます。
結果は、私たちのシステムが競合するアルゴリズムよりも大幅に優れていることを示しています。

要約(オリジナル)

Guitar tablatures enrich the structure of traditional music notation by assigning each note to a string and fret of a guitar in a particular tuning, indicating precisely where to play the note on the instrument. The problem of generating tablature from a symbolic music representation involves inferring this string and fret assignment per note across an entire composition or performance. On the guitar, multiple string-fret assignments are possible for most pitches, which leads to a large combinatorial space that prevents exhaustive search approaches. Most modern methods use constraint-based dynamic programming to minimize some cost function (e.g.\ hand position movement). In this work, we introduce a novel deep learning solution to symbolic guitar tablature estimation. We train an encoder-decoder Transformer model in a masked language modeling paradigm to assign notes to strings. The model is first pre-trained on DadaGP, a dataset of over 25K tablatures, and then fine-tuned on a curated set of professionally transcribed guitar performances. Given the subjective nature of assessing tablature quality, we conduct a user study amongst guitarists, wherein we ask participants to rate the playability of multiple versions of tablature for the same four-bar excerpt. The results indicate our system significantly outperforms competing algorithms.

arxiv情報

著者 Drew Edwards,Xavier Riley,Pedro Sarmento,Simon Dixon
発行日 2024-08-09 12:25:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.IR, cs.SD パーマリンク