要約
航空交通管制(ATC)における効果的なコミュニケーションは、航空の安全性を維持するために重要ですが、アクセントされた英語によってもたらされる課題は、自動音声認識(ASR)システムではほとんど対処されていないままです。
既存のモデルは、特に騒々しいATC環境で、東南アジアのアクセント(海洋アクセント)スピーチの転写精度と格闘しています。
この研究では、新しく作成されたデータセットを使用して、東南アジアのアクセント専用に微調整されたASRモデルの開発を示しています。
私たちの研究は大幅な改善を達成し、0.0982または9.82%の単語エラー率(WER)を達成しました。
さらに、このペーパーでは、地域固有のデータセットとアクセント中心のトレーニングの重要性を強調し、リソースに制約のある軍事作戦にASRシステムを展開するための経路を提供します。
調査結果は、ATC通信における非西洋アクセントの転写精度を改善するために、ノイズロビートレーニング技術と地域固有のデータセットの必要性を強調しています。
要約(オリジナル)
Effective communication in Air Traffic Control (ATC) is critical to maintaining aviation safety, yet the challenges posed by accented English remain largely unaddressed in Automatic Speech Recognition (ASR) systems. Existing models struggle with transcription accuracy for Southeast Asian-accented (SEA-accented) speech, particularly in noisy ATC environments. This study presents the development of ASR models fine-tuned specifically for Southeast Asian accents using a newly created dataset. Our research achieves significant improvements, achieving a Word Error Rate (WER) of 0.0982 or 9.82% on SEA-accented ATC speech. Additionally, the paper highlights the importance of region-specific datasets and accent-focused training, offering a pathway for deploying ASR systems in resource-constrained military operations. The findings emphasize the need for noise-robust training techniques and region-specific datasets to improve transcription accuracy for non-Western accents in ATC communications.
arxiv情報
著者 | Marcus Yu Zhe Wee,Justin Juin Hng Wong,Lynus Lim,Joe Yu Wei Tan,Prannaya Gupta,Dillion Lim,En Hao Tew,Aloysius Keng Siew Han,Yong Zhi Lim |
発行日 | 2025-02-27 17:35:59+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google