What makes a good pause? Investigating the turn-holding effects of fillers

要約

タイトル:
「良い休止とは何か? フィラーによるターンホールディング効果の調査」

要約:
-フィラー(「ええと」や「あの」といった音声の厳密な意味を持たない言葉)は、日常会話において頻用され、現在話している人が話し終えていないことを示唆するターンホールディングの手掛かりとして役立つ。
-本論文では、会話のダイナミクスを予測するために訓練されたディープラーニングモデルであるVoice Activity Projection(VAP)モデルを用いて、フィラーが期待されるターンホールド確率に及ぼす影響を分析する。
-結果は、フィラーが確かにターンホールド効果を持っていることを示しているが、他の手掛かりによる冗長性があるため、それほど強くないことがわかった。また、フィラーの音韻的特性や位置がターンホールド確率に重要な影響を与えることも分かった。
-ただし、以前の研究で示唆されたように、「ええと」と「あの」にはこの点での違いはなく、同じ効果があるという結果になった。

要約(オリジナル)

Filled pauses (or fillers), such as ‘uh’ and ‘um’, are frequent in spontaneous speech and can serve as a turn-holding cue for the listener, indicating that the current speaker is not done yet. In this paper, we use the recently proposed Voice Activity Projection (VAP) model, which is a deep learning model trained to predict the dynamics of conversation, to analyse the effects of filled pauses on the expected turn-hold probability. The results show that, while filled pauses do indeed have a turn-holding effect, it is perhaps not as strong as could be expected, probably due to the redundancy of other cues. We also find that the prosodic properties and position of the filler has a significant effect on the turn-hold probability. However, contrary to what has been suggested in previous work, there is no difference between ‘uh’ and ‘um’ in this regard.

arxiv情報

著者 Bing’er Jiang,Erik Ekstedt,Gabriel Skantze
発行日 2023-05-03 13:15:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL パーマリンク