The LAM Dataset: A Novel Benchmark for Line-Level Handwritten Text Recognition


手書きテキスト認識 (HTR) は、コンピューター ビジョンと自然言語処理が交差する未解決の問題です。
歴史的写本を扱う際の主な課題は、紙の支持体の保存、手書きの変動性 (同じ著者でも広い期間にわたるものでさえ)、および古代からのデータの不足によるものであり、十分に表現されていません。
このトピックに関する研究を促進する目的で、この論文では、Ludovico Antonio Muratori (LAM) データセットを紹介します。これは、1 人の著者が 60 年以上にわたって編集したイタリアの古代写本の行レベルの大規模な HTR データセットです。
データセットには、基本的な分割と、作成者の年齢を考慮した日付ベースの分割の 2 つの構成があります。
最初の設定は、イタリア語の古代文書の HTR を研究することを目的としていますが、2 番目の設定は、トレーニング データが利用できない期間に同じ作家によって書かれたテキストを認識する HTR システムの能力に焦点を当てています。
両方の構成について、定量的および定性的な特性を分析し、他のラインレベルの HTR ベンチマークに関しても分析し、最先端の HTR アーキテクチャの認識パフォーマンスを提示します。
データセットは、\url{} からダウンロードできます。


Handwritten Text Recognition (HTR) is an open problem at the intersection of Computer Vision and Natural Language Processing. The main challenges, when dealing with historical manuscripts, are due to the preservation of the paper support, the variability of the handwriting — even of the same author over a wide time-span — and the scarcity of data from ancient, poorly represented languages. With the aim of fostering the research on this topic, in this paper we present the Ludovico Antonio Muratori (LAM) dataset, a large line-level HTR dataset of Italian ancient manuscripts edited by a single author over 60 years. The dataset comes in two configurations: a basic splitting and a date-based splitting which takes into account the age of the author. The first setting is intended to study HTR on ancient documents in Italian, while the second focuses on the ability of HTR systems to recognize text written by the same writer in time periods for which training data are not available. For both configurations, we analyze quantitative and qualitative characteristics, also with respect to other line-level HTR benchmarks, and present the recognition performance of state-of-the-art HTR architectures. The dataset is available for download at \url{}.


著者 Silvia Cascianelli,Vittorio Pippi,Martin Maarand,Marcella Cornia,Lorenzo Baraldi,Christopher Kermorvant,Rita Cucchiara
発行日 2022-08-16 11:44:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV, cs.DL パーマリンク