MultiTurnCleanup: A Benchmark for Multi-Turn Spoken Conversational Transcript Cleanup


ただし、口頭での会話トランスクリプトには多数の不連続現象が複数のターンにわたって発生し、人間の可読性と下流の NLP タスクのパフォーマンスを妨げます。
この研究では、音声会話トランスクリプトに対する革新的なマルチターン クリーンアップ タスクを提案し、新しいデータセット MultiTurnCleanup1 を収集することで、これらの現象に対処します。
さらに、将来の研究のベンチマークとして実験評価に 2 つのモデリング アプローチを活用します。


Current disfluency detection models focus on individual utterances each from a single speaker. However, numerous discontinuity phenomena in spoken conversational transcripts occur across multiple turns, hampering human readability and the performance of downstream NLP tasks. This study addresses these phenomena by proposing an innovative Multi-Turn Cleanup task for spoken conversational transcripts and collecting a new dataset, MultiTurnCleanup1. We design a data labeling schema to collect the high-quality dataset and provide extensive data analysis. Furthermore, we leverage two modeling approaches for experimental evaluation as benchmarks for future research.


著者 Hua Shen,Vicky Zayats,Johann C. Rocholl,Daniel D. Walker,Dirk Padfield
発行日 2023-10-27 17:01:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク