要約
この論文では、スイスドイツ語の音声翻訳システムを構築する際の課題を調査し、特に方言の多様性の影響とスイスドイツ語と標準ドイツ語の違いに焦点を当てます。
スイスドイツ語は、正式な文字体系を持たない話し言葉であり、多くの多様な方言で構成され、話者が約 500 万人しかいないリソースの少ない言語です。
この研究は、2 つの主要な研究課題に基づいて行われます。それは、スイスドイツ語の音声翻訳モデルのトレーニング中に方言を含めたり除外したりすることが、特定の方言のパフォーマンスにどのような影響を与えるか、もう 1 つは、スイスドイツ語と標準ドイツ語の違いが、言語翻訳のパフォーマンスにどのような影響を与えるかということです。
システムは?
私たちは、方言の多様性と言語の違いがスイスドイツ語の音声翻訳に重大な課題をもたらしていることを示し、これは経験的調査から導き出された言語仮説と一致しています。
要約(オリジナル)
This paper investigates the challenges in building Swiss German speech translation systems, specifically focusing on the impact of dialect diversity and differences between Swiss German and Standard German. Swiss German is a spoken language with no formal writing system, it comprises many diverse dialects and is a low-resource language with only around 5 million speakers. The study is guided by two key research questions: how does the inclusion and exclusion of dialects during the training of speech translation models for Swiss German impact the performance on specific dialects, and how do the differences between Swiss German and Standard German impact the performance of the systems? We show that dialect diversity and linguistic differences pose significant challenges to Swiss German speech translation, which is in line with linguistic hypotheses derived from empirical investigations.
arxiv情報
著者 | Claudio Paonessa,Yanick Schraner,Jan Deriu,Manuela Hürlimann,Manfred Vogel,Mark Cieliebak |
発行日 | 2023-10-13 13:16:57+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google