A Unified Representation Framework for the Evaluation of Optical Music Recognition Systems

要約

現代の光学式音楽認識 (OMR) は、かなり細分化された分野です。
ほとんどの OMR アプローチは、独立していて相互に互換性のないデータセットを使用するため、データセットを組み合わせたり、その上に構築された認識システムを比較したりすることが困難になります。
この論文では、共通の音楽表現言語の必要性を特定し、調整、テクノロジーの再利用、およびコミュニティの取り組みの公正な評価を可能にする OMR 研究の共通エンドポイントを構築するという考えのもと、Music Tree Notation (MTN) フォーマットを提案します。
この形式は、音楽をより高度な抽象化ノードにグループ化するプリミティブのセットとして表し、完全なグラフベースの表現とシーケンシャル記譜形式の間の妥協点です。
また、このアイデアの概念実証として、OMR メトリクスの特定のセットとタイプセット スコア データセットも開発しました。

要約(オリジナル)

Modern-day Optical Music Recognition (OMR) is a fairly fragmented field. Most OMR approaches use datasets that are independent and incompatible between each other, making it difficult to both combine them and compare recognition systems built upon them. In this paper we identify the need of a common music representation language and propose the Music Tree Notation (MTN) format, with the idea to construct a common endpoint for OMR research that allows coordination, reuse of technology and fair evaluation of community efforts. This format represents music as a set of primitives that group together into higher-abstraction nodes, a compromise between the expression of fully graph-based and sequential notation formats. We have also developed a specific set of OMR metrics and a typeset score dataset as a proof of concept of this idea.

arxiv情報

著者 Pau Torras,Sanket Biswas,Alicia Fornés
発行日 2024-09-06 13:25:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, I.4.9 パーマリンク