Dialect Transfer for Swiss German Speech Translation


スイスドイツ語は、正式な文字体系を持たない話し言葉であり、多くの多様な方言で構成され、話者が約 500 万人しかいないリソースの少ない言語です。
この研究は、2 つの主要な研究課題に基づいて行われます。それは、スイスドイツ語の音声翻訳モデルのトレーニング中に方言を含めたり除外したりすることが、特定の方言のパフォーマンスにどのような影響を与えるか、もう 1 つは、スイスドイツ語と標準ドイツ語の違いが、言語翻訳のパフォーマンスにどのような影響を与えるかということです。


This paper investigates the challenges in building Swiss German speech translation systems, specifically focusing on the impact of dialect diversity and differences between Swiss German and Standard German. Swiss German is a spoken language with no formal writing system, it comprises many diverse dialects and is a low-resource language with only around 5 million speakers. The study is guided by two key research questions: how does the inclusion and exclusion of dialects during the training of speech translation models for Swiss German impact the performance on specific dialects, and how do the differences between Swiss German and Standard German impact the performance of the systems? We show that dialect diversity and linguistic differences pose significant challenges to Swiss German speech translation, which is in line with linguistic hypotheses derived from empirical investigations.


著者 Claudio Paonessa,Yanick Schraner,Jan Deriu,Manuela Hürlimann,Manfred Vogel,Mark Cieliebak
発行日 2023-10-13 13:16:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク