Bemba Speech Translation: Exploring a Low-Resource African Language

要約

このホワイトペーパーでは、スポークン言語翻訳に関する国際会議(IWSLT 2025)、低リソース言語トラック、つまりベンバから英語への音声翻訳のためのシステムへのシステムの提出について説明します。
WhisperとNLLB-200に基づいてカスケードされた音声翻訳システムを構築し、逆翻訳などのデータ増強技術を採用しました。
合成データを使用する効果を調査し、実験セットアップについて説明します。

要約(オリジナル)

This paper describes our system submission to the International Conference on Spoken Language Translation (IWSLT 2025), low-resource languages track, namely for Bemba-to-English speech translation. We built cascaded speech translation systems based on Whisper and NLLB-200, and employed data augmentation techniques, such as back-translation. We investigate the effect of using synthetic data and discuss our experimental setup.

arxiv情報

著者 Muhammad Hazim Al Farouq,Aman Kassahun Wassie,Yasmin Moslem
発行日 2025-05-26 14:32:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.SD, eess.AS パーマリンク