Huruf: An Application for Arabic Handwritten Character Recognition Using Deep Learning

要約

手書き認識は、人工知能の分野で大きな関心を集めてきた分野です。
実生活での幅広い使用例があるため、研究が広く行われています。
この分野では、主にラテン文字に焦点を当てた著名な研究が行われてきました。
ただし、アラビア語の手書き文字認識の領域は、まだ比較的未開拓です。
アラビア文字に固有の筆記体の性質と、個人によって異なる書き方があるため、作業はさらに困難になります。
この背後にあるいくつかの考えられる理由を特定し、アラビア文字と数字を認識するための軽量の畳み込みニューラル ネットワーク ベースのアーキテクチャを提案しました。
提案されたパイプラインは、畳み込み、プーリング、バッチ正規化、ドロップアウト、および最後に 1 つのグローバル平均プーリングと高密度レイヤーのそれぞれに 4 つのレイヤーを含む合計 18 レイヤーで構成されます。
さらに、オプティマイザの選択、カーネル初期化子、アクティベーション関数など、ハイパーパラメータのさまざまな選択を徹底的に調査しました。公開されている「アラビア語手書き文字データセット (AHCD)」および「修正アラビア語手書き数字データベース」で提案されたアーキテクチャを評価しています。
(MadBase) のデータセット、提案されたモデルはそれぞれ 96.93% と 99.35% の精度を達成しました。

要約(オリジナル)

Handwriting Recognition has been a field of great interest in the Artificial Intelligence domain. Due to its broad use cases in real life, research has been conducted widely on it. Prominent work has been done in this field focusing mainly on Latin characters. However, the domain of Arabic handwritten character recognition is still relatively unexplored. The inherent cursive nature of the Arabic characters and variations in writing styles across individuals makes the task even more challenging. We identified some probable reasons behind this and proposed a lightweight Convolutional Neural Network-based architecture for recognizing Arabic characters and digits. The proposed pipeline consists of a total of 18 layers containing four layers each for convolution, pooling, batch normalization, dropout, and finally one Global average pooling and a Dense layer. Furthermore, we thoroughly investigated the different choices of hyperparameters such as the choice of the optimizer, kernel initializer, activation function, etc. Evaluating the proposed architecture on the publicly available ‘Arabic Handwritten Character Dataset (AHCD)’ and ‘Modified Arabic handwritten digits Database (MadBase)’ datasets, the proposed model respectively achieved an accuracy of 96.93% and 99.35% which is comparable to the state-of-the-art and makes it a suitable solution for real-life end-level applications.

arxiv情報

著者 Minhaz Kamal,Fairuz Shaiara,Chowdhury Mohammad Abdullah,Sabbir Ahmed,Tasnim Ahmed,Md. Hasanul Kabir
発行日 2022-12-16 17:39:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク