Two Decades of Bengali Handwritten Digit Recognition: A Survey

要約

手書き文字認識(HDR)は、光学式文字認識(OCR)の分野では最も困難な課題の一つです。HDRには、言語に関係なく、個人、媒体、環境による書き方の違い、繰り返し書く際に同じストロークを維持できないなど、固有の課題があります。さらに、特定の言語では、数字の構造が複雑なため、HDRのシナリオが曖昧になることもあります。長年にわたり、研究者は、異なる画像処理技術を従来の機械学習(ML)ベースおよび/または深層学習(DL)ベースのアーキテクチャと組み合わせた、多数のオフラインおよびオンラインHDRパイプラインを開発してきました。HDRに関する広範なレビュー研究の証拠は、以下のような言語の文献に存在しますが。英語、アラビア語、インド語、ペルシャ語、中国語などの言語のHDRに関する文献はありますが、ベンガル語のHDR(BHDR)に関する調査はほとんどなく、課題、基礎となる認識プロセス、可能な将来の方向性についての包括的分析が欠けています。本論文では、ベンガル語の手書き数字の特徴と固有のあいまいさを、20年にわたる最先端のデータセットとオフラインBHDRに向けたアプローチの包括的な洞察とともに分析しました。さらに、BHDRに関連するいくつかの実際のアプリケーション固有の研究についても詳細に議論しています。本論文は、オフラインBHDRの背後にある科学に興味を持つ研究者のための大要としても機能し、さまざまな応用分野におけるベンガル語手書き数字のオフライン認識の向上につながる可能性のある関連研究の新たな道を探るきっかけとなることでしょう。

要約(オリジナル)

Handwritten Digit Recognition (HDR) is one of the most challenging tasks in the domain of Optical Character Recognition (OCR). Irrespective of language, there are some inherent challenges of HDR, which mostly arise due to the variations in writing styles across individuals, writing medium and environment, inability to maintain the same strokes while writing any digit repeatedly, etc. In addition to that, the structural complexities of the digits of a particular language may lead to ambiguous scenarios of HDR. Over the years, researchers have developed numerous offline and online HDR pipelines, where different image processing techniques are combined with traditional Machine Learning (ML)-based and/or Deep Learning (DL)-based architectures. Although evidence of extensive review studies on HDR exists in the literature for languages, such as: English, Arabic, Indian, Farsi, Chinese, etc., few surveys on Bengali HDR (BHDR) can be found, which lack a comprehensive analysis of the challenges, the underlying recognition process, and possible future directions. In this paper, the characteristics and inherent ambiguities of Bengali handwritten digits along with a comprehensive insight of two decades of the state-of-the-art datasets and approaches towards offline BHDR have been analyzed. Furthermore, several real-life application-specific studies, which involve BHDR, have also been discussed in detail. This paper will also serve as a compendium for researchers interested in the science behind offline BHDR, instigating the exploration of newer avenues of relevant research that may further lead to better offline recognition of Bengali handwritten digits in different application areas.

arxiv情報

著者 A. B. M. Ashikur Rahman,Md. Bakhtiar Hasan,Sabbir Ahmed,Tasnim Ahmed,Md. Hamjajul Ashmafee,Mohammad Ridwan Kabir,Md. Hasanul Kabir
発行日 2022-06-05 18:20:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク