The NUS-HLT System for ICASSP2024 ICMC-ASR Grand Challenge

要約

この文書は、車載マルチチャネル自動音声認識に関する ICMC-ASR チャレンジの両方のトラックにおける私たちのチームの取り組みを要約しています。
ICMC-ASR チャレンジに提出されたシステムには、マルチチャネル フロントエンドの強化とダイアライゼーション、トレーニング データの拡張、マルチチャネル ブランチによる音声認識モデリングが含まれます。
公式の Eval1 および Eval2 セットでテストしたところ、当社の最良のシステムは、公式のベースライン システムと比較して、CER で相対的に 34.3% の改善、cpCER で 56.5% の改善を達成しました。

要約(オリジナル)

This paper summarizes our team’s efforts in both tracks of the ICMC-ASR Challenge for in-car multi-channel automatic speech recognition. Our submitted systems for ICMC-ASR Challenge include the multi-channel front-end enhancement and diarization, training data augmentation, speech recognition modeling with multi-channel branches. Tested on the offical Eval1 and Eval2 set, our best system achieves a relative 34.3% improvement in CER and 56.5% improvement in cpCER, compared to the offical baseline system.

arxiv情報

著者 Meng Ge,Yizhou Peng,Yidi Jiang,Jingru Lin,Junyi Ao,Mehmet Sinan Yildirim,Shuai Wang,Haizhou Li,Mengling Feng
発行日 2023-12-26 11:11:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, eess.AS パーマリンク