Can we hear physical and social space together through prosody?

要約

人間の聞き手が音声ソースの空間位置を推測しようとするとき、耳に届く強度レベルに関係なく、話者の音量レベルの影響を受けます。
距離の認識は非常に難しい作業であるため、彼らは自分の経験に頼って、ささやき声で話す人は近くにおり、大声で話す人は遠くにいると認識します。
この研究は、日常生活環境において人間の話者によって生成される韻律の変化に対して同様の結果が得られるかどうかをテストすることを目的としています。
これは、目隠しをされた被験者が、強度と社会的影響に関する指示に従って単一の単語を発声した、訓練された女性話者の入ってくる音声の方向、話者の方向、および距離を推定する位置特定タスクで構成されます。
このプロトコルは 2 つの実験で実装されました。
まず、話者の奇妙な行動から被験者の注意をそらすために、複雑な口実タスクが使用されました。
それどころか、2 回目の実験では、被験者は韻律の変化を十分に認識しており、それによって知覚を適応させることができました。
結果は、口実タスクの重要性を示し、話者の方向の認識が声の強さによって影響を受ける可能性があることを示唆しています。

要約(オリジナル)

When human listeners try to guess the spatial position of a speech source, they are influenced by the speaker’s production level, regardless of the intensity level reaching their ears. Because the perception of distance is a very difficult task, they rely on their own experience, which tells them that a whispering talker is close to them, and that a shouting talker is far away. This study aims to test if similar results could be obtained for prosodic variations produced by a human speaker in an everyday life environment. It consists in a localization task, during which blindfolded subjects had to estimate the incoming voice direction, speaker orientation and distance of a trained female speaker, who uttered single words, following instructions concerning intensity and social-affect to be performed. This protocol was implemented in two experiments. First, a complex pretext task was used in order to distract the subjects from the strange behavior of the speaker. On the contrary, during the second experiment, the subjects were fully aware of the prosodic variations, which allowed them to adapt their perception. Results show the importance of the pretext task, and suggest that the perception of the speaker’s orientation can be influenced by voice intensity.

arxiv情報

著者 Ambre Davat,Véronique Aubergé,Gang Feng
発行日 2023-05-22 13:25:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク