Using Information Theory to Characterize Prosodic Typology: The Case of Tone, Pitch-Accent and Stress-Accent

要約

この論文は、語彙のアイデンティティと韻律の関係(言語変動のよく研究されたパラメーター)が情報理論を使用して特徴付けることができると主張しています。
韻律を使用して語彙の区別を使用する言語は、そうでない言語と比較して、単語のアイデンティティと韻律の間により高い相互情報を示すべきであると予測しています。
この仮説をピッチの領域でテストします。これは、広東語のような音色言語で語彙的区別を作成するために使用されます。
5つの言語ファミリの10の言語で文章を読み取るスピーカーのデータセットを使用して、テキストとピッチ曲線の間の相互情報を推定します。
言語間で、ピッチ曲線が同様の​​量のエントロピーを表示することがわかります。
ただし、これらの曲線は、ピッチおよびストレスアクセント言語と比較して、色調言語に関連するテキストを考慮して予測するのが簡単であるため、これらの言語では相互の情報が高く、仮説をサポートしています。
私たちの結果は、言語学的類型をカテゴリーではなく勾配と見なす視点をサポートしています。

要約(オリジナル)

This paper argues that the relationship between lexical identity and prosody — one well-studied parameter of linguistic variation — can be characterized using information theory. We predict that languages that use prosody to make lexical distinctions should exhibit a higher mutual information between word identity and prosody, compared to languages that don’t. We test this hypothesis in the domain of pitch, which is used to make lexical distinctions in tonal languages, like Cantonese. We use a dataset of speakers reading sentences aloud in ten languages across five language families to estimate the mutual information between the text and their pitch curves. We find that, across languages, pitch curves display similar amounts of entropy. However, these curves are easier to predict given their associated text in the tonal languages, compared to pitch- and stress-accent languages, and thus the mutual information is higher in these languages, supporting our hypothesis. Our results support perspectives that view linguistic typology as gradient, rather than categorical.

arxiv情報

著者 Ethan Gotlieb Wilcox,Cui Ding,Giovanni Acampa,Tiago Pimentel,Alex Warstadt,Tamar I. Regev
発行日 2025-05-12 15:25:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク