Topics in the Study of the Pragmatic Functions of Phonetic Reduction in Dialog

要約

調音精度の低下は音声では一般的ですが、対話についてはその音響特性と実用的な機能はほとんど研究されていません。
私たちはここでこのギャップを是正しようとしています。
この技術レポートには、雑誌論文 (Ward et al. 2024、投稿) から省略された内容が含まれています。
具体的には、ここでは、1) 知覚された減少に対する注釈付けについて学んだ教訓、2) 読み上げ音声とは異なり、対話における減少の相関関係には高音、広いピッチ範囲、および強度が含まれるという発見、および 3) 知覚の減少のベースライン モデルを報告します。
単純な音響/韻律特徴を使用して、対話の減少を予測します。これにより、英語では 0.24、スペイン語では 0.17 という人間の知覚との相関関係が得られます。
また、英語でのリダクションの追加の可能性のある実用的な関数の例や、さまざまな議論、観察、推測も提供します。

要約(オリジナル)

Reduced articulatory precision is common in speech, but for dialog its acoustic properties and pragmatic functions have been little studied. We here try to remedy this gap. This technical report contains content that was omitted from the journal article (Ward et al. 2024, submitted). Specifically, we here report 1) lessons learned about annotating for perceived reduction, 2) the finding that, unlike in read speech, the correlates of reduction in dialog include high pitch, wide pitch range, and intensity, and 3) a baseline model for predicting reduction in dialog, using simple acoustic/prosodic features, that achieves correlations with human perceptions of 0.24 for English, and 0.17 for Spanish. We also provide examples of additional possible pragmatic functions of reduction in English, and various discussion, observations and speculations

arxiv情報

著者 Nigel G. Ward,Carlos A. Ortega
発行日 2024-05-02 15:18:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク