Prosodic features improve sentence segmentation and parsing

要約

音声対話の解析では、明確な文の境界の欠如など、テキストの解析にはない課題が生じます。
以前の研究から、韻律が単一の文の解析に役立つことはわかっていますが (Tran et al. 2018)、文に分割されていない音声の解析に対する韻律の効果を示したいと思います。
English Switchboard コーパスでの実験では、韻律がモデルの解析と文の境界の正確な識別の両方に役立つことがわかりました。
ただし、最高のパフォーマンスを発揮するパーサーが、必ずしも最高の文セグメンテーション パフォーマンスを生み出すパーサーであるとは限りません。
代わりに、他の構成要素の境界と一緒に文の境界をモデル化することから最適な解析が得られることをお勧めします。

要約(オリジナル)

Parsing spoken dialogue presents challenges that parsing text does not, including a lack of clear sentence boundaries. We know from previous work that prosody helps in parsing single sentences (Tran et al. 2018), but we want to show the effect of prosody on parsing speech that isn’t segmented into sentences. In experiments on the English Switchboard corpus, we find prosody helps our model both with parsing and with accurately identifying sentence boundaries. However, we find that the best-performing parser is not necessarily the parser that produces the best sentence segmentation performance. We suggest that the best parses instead come from modelling sentence boundaries jointly with other constituent boundaries.

arxiv情報

著者 Elizabeth Nielsen,Sharon Goldwater,Mark Steedman
発行日 2023-02-23 17:03:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク