MultiTurnCleanup: A Benchmark for Multi-Turn Spoken Conversational Transcript Cleanup

要約

現在の非流暢性検出モデルは、単一の話者からの個々の発話に焦点を当てています。
ただし、口頭での会話トランスクリプトには多数の不連続現象が複数のターンにわたって発生し、人間の可読性と下流の NLP タスクのパフォーマンスを妨げます。
この研究では、音声会話トランスクリプトに対する革新的なマルチターン クリーンアップ タスクを提案し、新しいデータセット MultiTurnCleanup1 を収集することで、これらの現象に対処します。
高品質のデータセットを収集し、広範なデータ分析を提供するためにデータラベルスキーマを設計します。
さらに、将来の研究のベンチマークとして実験評価に 2 つのモデリング アプローチを活用します。

要約(オリジナル)

Current disfluency detection models focus on individual utterances each from a single speaker. However, numerous discontinuity phenomena in spoken conversational transcripts occur across multiple turns, hampering human readability and the performance of downstream NLP tasks. This study addresses these phenomena by proposing an innovative Multi-Turn Cleanup task for spoken conversational transcripts and collecting a new dataset, MultiTurnCleanup1. We design a data labeling schema to collect the high-quality dataset and provide extensive data analysis. Furthermore, we leverage two modeling approaches for experimental evaluation as benchmarks for future research.

arxiv情報

著者 Hua Shen,Vicky Zayats,Johann C. Rocholl,Daniel D. Walker,Dirk Padfield
発行日 2023-10-27 17:01:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク