North Sámi Dialect Identification with Self-supervised Speech Models

要約

北スミ (NS) 言語は、関連しているものの音韻、形態、語彙に違いがある 4 つの主要な方言変種をカプセル化しています。
NS 話者は地政学的に独特な位置にあるため、多くの場合、スミ語と、主な州言語であるノルウェー語、スウェーデン語、フィンランド語のバイリンガルであることがわかります。
これにより、話し言葉とその音響特性の両方に関して NS バリアントを研究できるようになります。
この論文では、MFCC と韻律特徴を含む広範な音響特徴と、最新の自己教師あり表現、つまり XLS-R、WavLM、HuBERT を自動検出するために調査します。
4 つの NS バリアント。
さらに、多数派の州言語が方言にどのように反映されているかを調査します。
我々の結果は、NS 方言が州言語の影響を受けており、4 つの方言が分離可能であり、特に XLS-R モデルで高い分類精度に達していることを示しています。

要約(オリジナル)

The North S\'{a}mi (NS) language encapsulates four primary dialectal variants that are related but that also have differences in their phonology, morphology, and vocabulary. The unique geopolitical location of NS speakers means that in many cases they are bilingual in S\'{a}mi as well as in the dominant state language: Norwegian, Swedish, or Finnish. This enables us to study the NS variants both with respect to the spoken state language and their acoustic characteristics. In this paper, we investigate an extensive set of acoustic features, including MFCCs and prosodic features, as well as state-of-the-art self-supervised representations, namely, XLS-R, WavLM, and HuBERT, for the automatic detection of the four NS variants. In addition, we examine how the majority state language is reflected in the dialects. Our results show that NS dialects are influenced by the state language and that the four dialects are separable, reaching high classification accuracy, especially with the XLS-R model.

arxiv情報

著者 Sofoklis Kakouros,Katri Hiovain-Asikainen
発行日 2023-05-19 17:53:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, eess.AS パーマリンク