Evaluating Automatic Speech Recognition Systems for Korean Meteorological Experts

要約

このペーパーでは、自動音声認識(ASR)を自然言語クエリシステムに統合して、韓国の気象学者の気象予測効率を改善することを調査します。
韓国気象領域、特に専門的な語彙と韓国の言語の複雑さのためのASRシステムの開発における課題に対処します。
これらの問題に取り組むために、ネイティブの韓国語話者が記録した音声クエリの評価データセットを作成しました。
このデータセットを使用して、多言語ASRモデルファミリのさまざまな構成を評価し、ドメイン固有の用語に関連するパフォーマンスの制限を特定しました。
次に、単純なテキストからスピーチベースのデータ増強方法を実装しました。これにより、一般的なドメインのパフォーマンスを維持しながら、専門用語の認識が向上しました。
貢献には、ドメイン固有のデータセットの作成、包括的なASRモデル評価、および効果的な増強技術が含まれます。
私たちの仕事は、韓国の気象予測領域のASRにおける将来の進歩の基盤を提供していると考えています。

要約(オリジナル)

This paper explores integrating Automatic Speech Recognition (ASR) into natural language query systems to improve weather forecasting efficiency for Korean meteorologists. We address challenges in developing ASR systems for the Korean weather domain, specifically specialized vocabulary and Korean linguistic intricacies. To tackle these issues, we constructed an evaluation dataset of spoken queries recorded by native Korean speakers. Using this dataset, we assessed various configurations of a multilingual ASR model family, identifying performance limitations related to domain-specific terminology. We then implemented a simple text-to-speech-based data augmentation method, which improved the recognition of specialized terms while maintaining general-domain performance. Our contributions include creating a domain-specific dataset, comprehensive ASR model evaluations, and an effective augmentation technique. We believe our work provides a foundation for future advancements in ASR for the Korean weather forecasting domain.

arxiv情報

著者 ChaeHun Park,Hojun Cho,Jaegul Choo
発行日 2025-03-12 13:18:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク