要約
言語モデリングで一般的に使用される word2vec 手法をメロディーに適用すると、音符が文内の単語として扱われ、ピッチ情報を取得できるようになります。
この研究では、20 曲の童謡とバッハのソナタからの抜粋の 2 つのデータセットを調査します。
埋め込みを定義するための意味空間は非常に小さい次元、具体的には 2 です。ノートは、コンテキストを確立する先行する 2、3、または 4 つのノートに基づいて予測されます。
結果の多変量解析により、音符を表す意味ベクトルとそのピッチとの重相関係数が約 0.80 であることがわかります。
要約(オリジナル)
Applying the word2vec technique, commonly used in language modeling, to melodies, where notes are treated as words in sentences, enables the capture of pitch information. This study examines two datasets: 20 children’s songs and an excerpt from a Bach sonata. The semantic space for defining the embeddings is of very small dimension, specifically 2. Notes are predicted based on the 2, 3 or 4 preceding notes that establish the context. A multivariate analysis of the results shows that the semantic vectors representing the notes have a multiple correlation coefficient of approximately 0.80 with their pitches.
arxiv情報
著者 | Daniel Defays |
発行日 | 2024-10-29 17:38:27+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google