要約
歴史的文書コレクションのデジタル化に対する差し迫った必要性は、自動手書きテキスト認識 (HTR) のためのコンピュータ化された画像処理方法の設計に強い関心をもたらしました。
手書きのテキストは、書き方、言語、スクリプトが異なるため、変動性が高くなります。
正確で堅牢な HTR システムのトレーニングには、十分な量の注釈付きマルチライター テキストが利用できないため、データ効率の高いアプローチが必要です。
ここでは、進行中のプロジェクト「マージンと機械学習」のケーススタディを紹介します。これは、手書きのマージンテキスト、つまり余白に書かれたテキストや手書きのメモの自動検出と認識に焦点を当てています。
辺縁部の検出にはより高速な R-CNN ネットワークが使用され、単語認識には AttentionHTR が使用されます。
このデータは、ウプサラ大学図書館で見つかった初期の書籍コレクション (印刷されたもの) からのもので、手書きの余白テキストが含まれています。
ソース コードと事前トレーニング済みのモデルは、https://github.com/ektavats/Project-Marginalia で入手できます。
要約(オリジナル)
The pressing need for digitization of historical document collections has led to a strong interest in designing computerised image processing methods for automatic handwritten text recognition (HTR). Handwritten text possesses high variability due to different writing styles, languages and scripts. Training an accurate and robust HTR system calls for data-efficient approaches due to the unavailability of sufficient amounts of annotated multi-writer text. A case study on an ongoing project “Marginalia and Machine Learning’ is presented here that focuses on automatic detection and recognition of handwritten marginalia texts i.e., text written in margins or handwritten notes. Faster R-CNN network is used for detection of marginalia and AttentionHTR is used for word recognition. The data comes from early book collections (printed) found in the Uppsala University Library, with handwritten marginalia texts. Source code and pretrained models are available at https://github.com/ektavats/Project-Marginalia.
arxiv情報
著者 | Adam Axelsson,Liang Cheng,Jonas Frankemölle,Ekta Vats |
発行日 | 2023-03-10 14:00:53+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google