Frechet Music Distance: A Metric For Generative Symbolic Music Evaluation

要約

この論文では、コンピューター ビジョンの Frechet Inception Distance (FID) と生成オーディオの Frechet Audio Distance (FAD) にヒントを得た、生成記号音楽モデルの新しい評価指標である Frechet Music Distance (FMD) を紹介します。
FMD は、参照の分布と生成された象徴的な音楽の埋め込みの分布間の距離を計算し、抽象的な音楽の特徴を捉えます。
私たちは、いくつかのデータセットとモデルにわたって FMD を検証します。
結果は、FMD がモデルの品質を効果的に区別し、記号音楽の生成を評価するための領域固有の指標を提供し、記号音楽モデリングの将来の研究のための再現可能な基準を確立することを示しています。

要約(オリジナル)

In this paper we introduce the Frechet Music Distance (FMD), a novel evaluation metric for generative symbolic music models, inspired by the Frechet Inception Distance (FID) in computer vision and Frechet Audio Distance (FAD) in generative audio. FMD calculates the distance between distributions of reference and generated symbolic music embeddings, capturing abstract musical features. We validate FMD across several datasets and models. Results indicate that FMD effectively differentiates model quality, providing a domain-specific metric for evaluating symbolic music generation, and establishing a reproducible standard for future research in symbolic music modeling.

arxiv情報

著者 Jan Retkowski,Jakub Stępniak,Mateusz Modrzejewski
発行日 2025-01-16 17:56:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.MM, cs.SD, eess.AS パーマリンク