Learning based Ge’ez character handwritten recognition

要約

文化的、歴史的に重要な古代エチオピア文字であるゲズ文字は、手書き認識研究ではほとんど無視されており、貴重な写本のデジタル化を妨げています。
私たちの研究では、畳み込みニューラル ネットワーク (CNN) と長短期記憶 (LSTM) ネットワークを使用した最先端の Ge’ez 手書き認識システムを開発することで、このギャップに対処しています。
私たちのアプローチでは 2 段階の認識プロセスが使用されます。
まず、CNN が個々の文字を認識するようにトレーニングされ、LSTM ベースの単語認識システムの特徴抽出器として機能します。
当社のデュアルステージ認識アプローチは、Ge’ez 手書き認識で新たな最高スコアを達成し、SVTR、ASTER などの 8 つの最先端の方法や、HHD エチオピア データセットで測定された人間のパフォーマンスを上回りました。
仕事。
この研究は、歴史文書のデジタル化、教育ツール、文化保存に影響を与え、ゲズ文化遺産の保存とアクセスのしやすさを大幅に前進させます。
コードは承認され次第公開されます。

要約(オリジナル)

Ge’ez, an ancient Ethiopic script of cultural and historical significance, has been largely neglected in handwriting recognition research, hindering the digitization of valuable manuscripts. Our study addresses this gap by developing a state-of-the-art Ge’ez handwriting recognition system using Convolutional Neural Networks (CNNs) and Long Short-Term Memory (LSTM) networks. Our approach uses a two-stage recognition process. First, a CNN is trained to recognize individual characters, which then acts as a feature extractor for an LSTM-based system for word recognition. Our dual-stage recognition approach achieves new top scores in Ge’ez handwriting recognition, outperforming eight state-of-the-art methods, which are SVTR, ASTER, and others as well as human performance, as measured in the HHD-Ethiopic dataset work. This research significantly advances the preservation and accessibility of Ge’ez cultural heritage, with implications for historical document digitization, educational tools, and cultural preservation. The code will be released upon acceptance.

arxiv情報

著者 Hailemicael Lulseged Yimer,Hailegabriel Dereje Degefa,Marco Cristani,Federico Cunico
発行日 2024-11-20 14:22:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク