要約
会話は、社会的、認知的、計算科学に対する関心の高まりの対象です。
それでも、会話のデータセットがサイズと複雑さを増やし続けるにつれて、研究者は、音声からテキストの成績証明書を会話ターンにセグメント化するためのスケーラブルな方法を欠いています。
この課題について説明し、自然主義交換のダイナミクスを正確にキャプチャするように設計されたターンセグメンテーションアルゴリズム「ナチュラル」を導入します。
ナチュラルは、スピーカーの主要な会話ターンを、バックチャネル、短い間隔、および会話を特徴付ける他の形式の並列スピーチなど、リスナーの二次的な発話から際立たせることによって機能します。
大規模な会話コーパスからのデータを使用して、既存の方法から派生した転写産物と比較して、天然導体由来の転写産物がどのように好ましい統計的および推論的特性を示すかを示します。
天然ターンアルゴリズムは、マシンで生成された転写処理方法の改善、または研究者が会話科学の中心的な目標である社会的相互作用から生じるより広範な結果とターンテイキングのダイナミクスをリンクできるようにする「ターンモデル」を表します。
要約(オリジナル)
Conversation is the subject of increasing interest in the social, cognitive, and computational sciences. And yet, as conversational datasets continue to increase in size and complexity, researchers lack scalable methods to segment speech-to-text transcripts into conversational turns-the basic building blocks of social interaction. We discuss this challenge and then introduce ‘NaturalTurn,’ a turn segmentation algorithm designed to accurately capture the dynamics of naturalistic exchange. NaturalTurn operates by distinguishing speakers’ primary conversational turns from listeners’ secondary utterances, such as backchannels, brief interjections, and other forms of parallel speech that characterize conversation. Using data from a large conversation corpus, we show how NaturalTurn-derived transcripts demonstrate favorable statistical and inferential characteristics compared to transcripts derived from existing methods. The NaturalTurn algorithm represents an improvement in machine-generated transcript processing methods, or ‘turn models’ that will enable researchers to link turn-taking dynamics with the broader outcomes that result from social interaction, a central goal of conversation science.
arxiv情報
著者 | Gus Cooney,Andrew Reece |
発行日 | 2025-02-19 15:21:02+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google