要約
Dialogue State Tracking (DST) は、タスク指向の対話システムの重要な部分であり、会話内の重要な情報を識別します。
ただし、自動音声認識 (ASR) システムによる固有表現エラーにより、音声対話環境ではその精度が大幅に低下します。
これらのエンティティをターゲットにして DST モデルの堅牢性を向上させる、シンプルかつ効果的なデータ拡張手法を紹介します。
私たちの新しい方法では、音声的に類似したエラーを導入しながら、キーワードで強調表示されたプロンプトを使用してエラーの配置を制御できます。
その結果、私たちの方法はキーワードに対して十分なエラー パターンを生成し、ノイズのある低精度の ASR 環境での精度の向上につながりました。
要約(オリジナル)
Dialogue State Tracking (DST) is a key part of task-oriented dialogue systems, identifying important information in conversations. However, its accuracy drops significantly in spoken dialogue environments due to named entity errors from Automatic Speech Recognition (ASR) systems. We introduce a simple yet effective data augmentation method that targets those entities to improve the robustness of DST model. Our novel method can control the placement of errors using keyword-highlighted prompts while introducing phonetically similar errors. As a result, our method generated sufficient error patterns on keywords, leading to improved accuracy in noised and low-accuracy ASR environments.
arxiv情報
著者 | Jihyun Lee,Solee Im,Wonjun Lee,Gary Geunbae Lee |
発行日 | 2024-09-10 07:06:40+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google