Quantifying the perceptual value of lexical and non-lexical channels in speech

要約

音声は、情報を伝達するための 2 つのチャネルを提供する基本的なコミュニケーション手段です。1 つは単語が発声される語彙チャネル、もう 1 つは単語がどのように話されるかという非語彙チャネルです。
どちらのチャネルも、今後のコミュニケーションに対するリスナーの期待を形成します。
ただし、期待に対する相対的な影響を直接定量化することは困難です。
これまでの試みでは、語彙的に同等の会話の展開や顕著な音響操作の音声バリエーションが必要でした。
この論文では、制約のない語彙内容にわたる対話における非語彙情報の価値を研究するための一般化されたパラダイムを紹介します。
精度とエントロピー削減の両方で非語彙チャネルの知覚価値を定量化することにより、非語彙情報が今後の対話の期待に一貫した影響を与えることを示します。たとえ非語彙情報が語彙コンテンツのみよりも劣った識別ターン判断につながる場合でも、
参加者間でより高いコンセンサスが得られます。

要約(オリジナル)

Speech is a fundamental means of communication that can be seen to provide two channels for transmitting information: the lexical channel of which words are said, and the non-lexical channel of how they are spoken. Both channels shape listener expectations of upcoming communication; however, directly quantifying their relative effect on expectations is challenging. Previous attempts require spoken variations of lexically-equivalent dialogue turns or conspicuous acoustic manipulations. This paper introduces a generalised paradigm to study the value of non-lexical information in dialogue across unconstrained lexical content. By quantifying the perceptual value of the non-lexical channel with both accuracy and entropy reduction, we show that non-lexical information produces a consistent effect on expectations of upcoming dialogue: even when it leads to poorer discriminative turn judgements than lexical content alone, it yields higher consensus among participants.

arxiv情報

著者 Sarenne Wallbridge,Peter Bell,Catherine Lai
発行日 2023-07-07 11:44:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.IT, math.IT パーマリンク