A Comprehensive Study of the Current State-of-the-Art in Nepali Automatic Speech Recognition Systems

要約

本稿では、ネパール語の自動音声認識(ASR)の分野で行われた研究を調査する。この調査の主な目的は、これまでに完了したネパール語の自動音声認識システムに関する研究を包括的にレビューし、使用されたさまざまなデータセットを調査し、利用された技術を検討し、ネパール語のASRシステムを実装する際に遭遇した障害を考慮することである。音声認識に基づく研究が増え続けている世界的な傾向と連動して、ネパールのASR関連プロジェクトの数も増加している。にもかかわらず、ネパール語の言語・音響モデルの研究は、豊富なリソースを持つ言語に比べて十分な関心を集めていません。このような状況において、我々は今後の研究の方向性とともにフレームワークを提供する。

要約(オリジナル)

In this paper, we examine the research conducted in the field of Nepali Automatic Speech Recognition (ASR). The primary objective of this survey is to conduct a comprehensive review of the works on Nepali Automatic Speech Recognition Systems completed to date, explore the different datasets used, examine the technology utilized, and take account of the obstacles encountered in implementing the Nepali ASR system. In tandem with the global trends of ever-increasing research on speech recognition based research, the number of Nepalese ASR-related projects are also growing. Nevertheless, the investigation of language and acoustic models of the Nepali language has not received adequate attention compared to languages that possess ample resources. In this context, we provide a framework as well as directions for future investigations.

arxiv情報

著者 Rupak Raj Ghimire,Bal Krishna Bal,Prakash Poudyal
発行日 2024-02-05 14:34:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL, cs.SD, eess.AS パーマリンク