要約
この文書は、車載マルチチャネル自動音声認識に関する ICMC-ASR チャレンジの両方のトラックにおける私たちのチームの取り組みを要約しています。
ICMC-ASR チャレンジに提出されたシステムには、マルチチャネル フロントエンドの強化とダイアライゼーション、トレーニング データの拡張、マルチチャネル ブランチによる音声認識モデリングが含まれます。
公式の Eval1 および Eval2 セットでテストしたところ、当社の最良のシステムは、公式のベースライン システムと比較して、CER で相対的に 34.3% の改善、cpCER で 56.5% の改善を達成しました。
要約(オリジナル)
This paper summarizes our team’s efforts in both tracks of the ICMC-ASR Challenge for in-car multi-channel automatic speech recognition. Our submitted systems for ICMC-ASR Challenge include the multi-channel front-end enhancement and diarization, training data augmentation, speech recognition modeling with multi-channel branches. Tested on the offical Eval1 and Eval2 set, our best system achieves a relative 34.3% improvement in CER and 56.5% improvement in cpCER, compared to the offical baseline system.
arxiv情報
著者 | Meng Ge,Yizhou Peng,Yidi Jiang,Jingru Lin,Junyi Ao,Mehmet Sinan Yildirim,Shuai Wang,Haizhou Li,Mengling Feng |
発行日 | 2023-12-26 11:11:22+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google