Baybayin Character Instance Detection

要約

タイトル:Baybayin文字のインスタンス検出
要約:

– フィリピン政府は最近、フィリピンのテキストでBaybayinを使用することを推進する「国民文字システム法案」を可決しました。
– このようなBaybayinの使用を促進する取り組みを支援するために、Baybayinスクリプトを容易に読むことができない人々を支援することができるコンピュータビジョンシステムを提供します。
– この論文では、コンピュータビジョンと機械学習の技術を使用してBaybayinスクリプトを識別する既存の方法を調査し、その可能性と制限について説明します。
– さらに、最新の畳み込みニューラルネットワーク(CNN)を使用したBaybayin Optical Character Instance Segmentation and Classificationモデルを提案し、画像内のBaybayin文字インスタンスを検出し、各文字インスタンスのラテンアルファベット相当を出力します。
– これまでの多くのシステムは、文字レベルの画像分類に限定されており、アクセント記号を持つ文字を誤って分類したり、ネイティブサポートしていなかったりすることがよくあります。
– さらに、これらの既存のモデルは、クリアリティーやコントラストなど、制限された設定でBaybayinテキストを分類することを制限する特定の入力要件を持っていることがよくあります。
– 私たちの提案された方法は、Baybayinのための最初のエンドツーエンドの文字インスタンス検出モデルであり、mAP50スコア93.30%、mAP50-95スコア80.50%、およびF1スコア84.84%を達成しています。

要約(オリジナル)

The Philippine Government recently passed the ‘National Writing System Act,’ which promotes using Baybayin in Philippine texts. In support of this effort to promote the use of Baybayin, we present a computer vision system which can aid individuals who cannot easily read Baybayin script. In this paper, we survey the existing methods of identifying Baybayin scripts using computer vision and machine learning techniques and discuss their capabilities and limitations. Further, we propose a Baybayin Optical Character Instance Segmentation and Classification model using state-of-the-art Convolutional Neural Networks (CNNs) that detect Baybayin character instances in an image then outputs the Latin alphabet counterparts of each character instance in the image. Most existing systems are limited to character-level image classification and often misclassify or not natively support characters with diacritics. In addition, these existing models often have specific input requirements that limit it to classifying Baybayin text in a controlled setting, such as limitations in clarity and contrast, among others. To our knowledge, our proposed method is the first end-to-end character instance detection model for Baybayin, achieving a mAP50 score of 93.30%, mAP50-95 score of 80.50%, and F1-Score of 84.84%.

arxiv情報

著者 Adriel Isaiah V. Amoguis,Gian Joseph B. Madrid,Benito Miguel D. Flores IV,Macario O. Cordel II
発行日 2023-04-19 07:35:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CV パーマリンク