要約
本論文では、デーヴァナーガリー文字で書かれたシンディー語のテキストをペルソアラビア文字に変換する文字変換(音訳)技術を紹介する。ルールベースを使ってテキストの一部を変換し、曖昧さが生じた場合には確率モデルを用いて解決するという、ハイブリッドなアプローチを取り入れることによって、この技術を示しました。このアプローチにより、システムは99.64%の総合的な精度を達成しました。
要約(オリジナル)
In this paper, we have shown a script conversion (transliteration) technique that converts Sindhi text in the Devanagari script to the Perso-Arabic script. We showed this by incorporating a hybrid approach where some part of the text is converted using a rule base and in case an ambiguity arises then a probabilistic model is used to resolve the same. Using this approach, the system achieved an overall accuracy of 99.64%.
arxiv情報
著者 | Shivani Singh Rathore,Bharti Nathani,Nisheeth Joshi,Pragya Katyayan,Chander Prakash Dadlani |
発行日 | 2023-05-12 10:29:37+00:00 |
arxivサイト | arxiv_id(pdf) |