Transformer based Urdu Handwritten Text Optical Character Reader

要約

手書き文字の抽出は、情報をデジタル化し、大規模な設定に利用できるようにするための最も重要な要素の一つである。手書き文字OCRは、コンピュータビジョンと自然言語処理コンピューティングの研究課題であり、英語については多くの研究がなされていますが、残念ながらウルドゥー語のような低資源言語についてはほとんど研究されていません。ウルドゥー語は草書体であり、相対的な位置によって文字の形が変わるため、複雑な特徴を理解し、あらゆる種類の手書きスタイルに対応できるモデルを提案する必要がある。本研究では、変換器を用いたウルドゥー語の手書き文字抽出モデルを提案する。変換器は自然言語理解タスクで非常に成功しているため、我々は複雑なウルドゥー語の手書き文字を理解するために、さらに変換器を探索する。

要約(オリジナル)

Extracting Handwritten text is one of the most important components of digitizing information and making it available for large scale setting. Handwriting Optical Character Reader (OCR) is a research problem in computer vision and natural language processing computing, and a lot of work has been done for English, but unfortunately, very little work has been done for low resourced languages such as Urdu. Urdu language script is very difficult because of its cursive nature and change of shape of characters based on it’s relative position, therefore, a need arises to propose a model which can understand complex features and generalize it for every kind of handwriting style. In this work, we propose a transformer based Urdu Handwritten text extraction model. As transformers have been very successful in Natural Language Understanding task, we explore them further to understand complex Urdu Handwriting.

arxiv情報

著者 Mohammad Daniyal Shaiq,Musa Dildar Ahmed Cheema,Ali Kamal
発行日 2022-06-09 15:43:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CV, cs.IR, cs.LG パーマリンク