Improved POS tagging for spontaneous, clinical speech using data augmentation

要約

この論文では、臨床集団からの音声トランスクリプトの POS タグ付けを改善するという問題について取り上げます。
文字起こしされた音声の解析と POS タグ付けに関する以前の研究とは対照的に、トレーニングにはドメイン内のツリーバンクを使用しません。
代わりに、データ拡張技術を使用してニュースワイヤーのドメイン外のツリーバンクでトレーニングし、これらの構造を自然な自発的な音声に似せています。
私たちは、拡張データを使用してパーサーをトレーニングし、拡張データを使用せずにパーサーをトレーニングし、さまざまな種類の神経変性状態の患者が発する臨床音声で手動で検証された POS タグを使用してそのパフォーマンスをテストしました。

要約(オリジナル)

This paper addresses the problem of improving POS tagging of transcripts of speech from clinical populations. In contrast to prior work on parsing and POS tagging of transcribed speech, we do not make use of an in domain treebank for training. Instead, we train on an out of domain treebank of newswire using data augmentation techniques to make these structures resemble natural, spontaneous speech. We trained a parser with and without the augmented data and tested its performance using manually validated POS tags in clinical speech produced by patients with various types of neurodegenerative conditions.

arxiv情報

著者 Seth Kulick,Neville Ryant,David J. Irwin,Naomi Nevler,Sunghye Cho
発行日 2023-07-11 20:42:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク