要約
手書き文字認識は、パターン認識や人工知能の分野において、研究の中心であり、ベンチマーク的な問題であり、現在も挑戦的な研究テーマである。その応用範囲の広さから、この分野では様々な言語に焦点を当てた研究が行われてきました。アラビア語は多様な言語であるため、潜在的な課題を含む膨大な研究領域があります。本論文では、アラビア語の手書き数字を認識するための畳み込みニューラルネットワークモデルを提案し、深層学習アプローチに必要な堅牢性を追加するために、データセットに様々な補強を施している。提案手法は、データのオーバーフィッティングの問題を解消するために、ドロップアウト正則化の存在によって強化される。さらに、活性化関数に適切な変更を加えることで、勾配が消失する問題を克服している。これらの修正により、提案システムは99.4%の精度を達成し、データセットに関するあらゆる先行研究よりも優れた性能を発揮する。
要約(オリジナル)
Handwritten character recognition has been the center of research and a benchmark problem in the sector of pattern recognition and artificial intelligence, and it continues to be a challenging research topic. Due to its enormous application many works have been done in this field focusing on different languages. Arabic, being a diversified language has a huge scope of research with potential challenges. A convolutional neural network model for recognizing handwritten numerals in Arabic language is proposed in this paper, where the dataset is subject to various augmentation in order to add robustness needed for deep learning approach. The proposed method is empowered by the presence of dropout regularization to do away with the problem of data overfitting. Moreover, suitable change is introduced in activation function to overcome the problem of vanishing gradient. With these modifications, the proposed system achieves an accuracy of 99.4\% which performs better than every previous work on the dataset.
arxiv情報
| 著者 | Akm Ashiquzzaman,Abdul Kawsar Tushar,Md Ashiqur Rahman |
| 発行日 | 2022-09-08 13:50:55+00:00 |
| arxivサイト | arxiv_id(pdf) |