Controlling Surprisal in Music Generation via Information Content Curve Matching


この目標を達成するために、瞬間情報コンテンツ (IIC) と呼ばれる指標を定義します。
IIC は、知覚された音楽的驚き (確率モデルから推定) の代理関数として機能し、音楽作品内の任意の時点で計算できます。
ビームサーチを使用して、IIC 曲線が特定のターゲット IIC に近似する音楽素材を生成します。
我々は、IIC が和声やリズムの複雑さ、音の密度と相関していることを実験的に示しています。
相関関係は、IIC の推定に使用される音楽コンテキストの長さに応じて減少します。
最後に、定性的なユーザー調査を実施して、人間のリスナーがそれぞれの音楽素材を生成するときにターゲットとして使用された IIC 曲線を識別できるかどうかをテストします。
IIC 補間と IIC 視覚化を作成するためのコードを で提供しています。


In recent years, the quality and public interest in music generation systems have grown, encouraging research into various ways to control these systems. We propose a novel method for controlling surprisal in music generation using sequence models. To achieve this goal, we define a metric called Instantaneous Information Content (IIC). The IIC serves as a proxy function for the perceived musical surprisal (as estimated from a probabilistic model) and can be calculated at any point within a music piece. This enables the comparison of surprisal across different musical content even if the musical events occur in irregular time intervals. We use beam search to generate musical material whose IIC curve closely approximates a given target IIC. We experimentally show that the IIC correlates with harmonic and rhythmic complexity and note density. The correlation decreases with the length of the musical context used for estimating the IIC. Finally, we conduct a qualitative user study to test if human listeners can identify the IIC curves that have been used as targets when generating the respective musical material. We provide code for creating IIC interpolations and IIC visualizations on


著者 Mathias Rose Bjare,Stefan Lattner,Gerhard Widmer
発行日 2024-08-12 09:21:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS パーマリンク