要約
新しい霜-EMA(フィンランド語とロシアの口頭発話データセットの電磁アーチキログラフィー)を紹介します。
これは、母国語(L1)、第二言語(L2)、および模倣L2(偽の外国のアクセント)でスピーチを生成した18人のバイリンガルスピーカーで構成されています。
新しいコーパスは、音声および技術的観点からの言語の変動性の研究を可能にします。
したがって、両方の視点を実証するために、2つの予備的なケーススタディを含めます。
最初のケーススタディでは、L2とL2の自動スピーカー検証システムのパフォーマンスに対する模倣の影響を調査し、2番目のケースはL1、L2、および偽のアクセントの1つのスピーカーの関節パターンを示しています。
要約(オリジナル)
We introduce a new FROST-EMA (Finnish and Russian Oral Speech Dataset of Electromagnetic Articulography) corpus. It consists of 18 bilingual speakers, who produced speech in their native language (L1), second language (L2), and imitated L2 (fake foreign accent). The new corpus enables research into language variability from phonetic and technological points of view. Accordingly, we include two preliminary case studies to demonstrate both perspectives. The first case study explores the impact of L2 and imitated L2 on the performance of an automatic speaker verification system, while the second illustrates the articulatory patterns of one speaker in L1, L2, and a fake accent.
arxiv情報
著者 | Satu Hopponen,Tomi Kinnunen,Alexandre Nikolaev,Rosa González Hautamäki,Lauri Tavi,Einar Meister |
発行日 | 2025-06-10 16:52:11+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google