Keyword-Aware ASR Error Augmentation for Robust Dialogue State Tracking

要約

Dialogue State Tracking (DST) は、タスク指向の対話システムの重要な部分であり、会話内の重要な情報を識別します。
ただし、自動音声認識 (ASR) システムによる固有表現エラーにより、音声対話環境ではその精度が大幅に低下します。
これらのエンティティをターゲットにして DST モデルの堅牢性を向上させる、シンプルかつ効果的なデータ拡張手法を紹介します。
私たちの新しい方法では、音声的に類似したエラーを導入しながら、キーワードで強調表示されたプロンプトを使用してエラーの配置を制御できます。
その結果、私たちの方法はキーワードに対して十分なエラー パターンを生成し、ノイズのある低精度の ASR 環境での精度の向上につながりました。

要約(オリジナル)

Dialogue State Tracking (DST) is a key part of task-oriented dialogue systems, identifying important information in conversations. However, its accuracy drops significantly in spoken dialogue environments due to named entity errors from Automatic Speech Recognition (ASR) systems. We introduce a simple yet effective data augmentation method that targets those entities to improve the robustness of DST model. Our novel method can control the placement of errors using keyword-highlighted prompts while introducing phonetically similar errors. As a result, our method generated sufficient error patterns on keywords, leading to improved accuracy in noised and low-accuracy ASR environments.

arxiv情報

著者 Jihyun Lee,Solee Im,Wonjun Lee,Gary Geunbae Lee
発行日 2024-09-10 07:06:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク