要約
本論文では、国際音声言語翻訳会議(IWSLT2025)の低リソース言語トラックに提出した、ベンバ語から英語への音声翻訳システムについて述べる。WhisperとNLLB-200をベースとしたカスケード型音声翻訳システムを構築し、逆翻訳などのデータ補強技術を採用した。合成データを使用した場合の効果を調査し、実験セットアップについて述べる。
要約(オリジナル)
This paper describes our system submission to the International Conference on Spoken Language Translation (IWSLT 2025), low-resource languages track, namely for Bemba-to-English speech translation. We built cascaded speech translation systems based on Whisper and NLLB-200, and employed data augmentation techniques, such as back-translation. We investigate the effect of using synthetic data and discuss our experimental setup.
arxiv情報
著者 | Muhammad Hazim Al Farouq,Aman Kassahun Wassie,Yasmin Moslem |
発行日 | 2025-05-05 09:51:56+00:00 |
arxivサイト | arxiv_id(pdf) |