Error correction and extraction in request dialogs

要約

ユーザの最後の 2 つの発話を取得し、最後の発話が最後から 2 番目の発話の誤り訂正であるかどうかを検出できる対話システム ユーティリティ コンポーネントを提案します。
はいの場合、最後の発話の誤り訂正に従って最後から 2 番目の発話を修正し、抽出された再パラランダムと修復エンティティのペアを出力します。
このコンポーネントには 2 つの利点があります。1 つは新しいドメインごとに修正を収集することを避けるための修正の概念を学習すること、もう 1 つはそこから学習する可能性を提供するリパランダムと修復のペアを抽出することです。
誤り訂正のために、1 つのシーケンスのラベル付けと 2 つのシーケンス間のアプローチが提示されます。
誤り訂正検出には、これら 3 つの誤り訂正アプローチも使用できます。さらに、シーケンス分類アプローチも提示します。
1 つのエラー訂正検出と 1 つのエラー訂正アプローチをパイプラインに組み合わせたり、エラー訂正アプローチをトレーニングしてエンドツーエンドで使用して 2 つのコンポーネントを回避したりできます。
EPIC-KITCHENS-100 データセットを変更して、リクエスト ダイアログ内のエンティティ フレーズを修正するアプローチを評価しました。
エラー訂正の検出と訂正については、合成検証データでは 96.40 % の精度が得られ、人間が作成した実際のテスト データでは 77.81 % の精度が得られました。

要約(オリジナル)

We propose a dialog system utility component that gets the last two utterances of a user and can detect whether the last utterance is an error correction of the second last utterance. If yes, it corrects the second last utterance according to the error correction in the last utterance and outputs the extracted pairs of reparandum and repair entity. This component offers two advantages, learning the concept of corrections to avoid collecting corrections for every new domain and extracting reparandum and repair pairs, which offers the possibility to learn out of it. For the error correction one sequence labeling and two sequence to sequence approaches are presented. For the error correction detection these three error correction approaches can also be used and in addition, we present a sequence classification approach. One error correction detection and one error correction approach can be combined to a pipeline or the error correction approaches can be trained and used end-to-end to avoid two components. We modified the EPIC-KITCHENS-100 dataset to evaluate the approaches for correcting entity phrases in request dialogs. For error correction detection and correction, we got an accuracy of 96.40 % on synthetic validation data and an accuracy of 77.81 % on human-created real-world test data.

arxiv情報

著者 Stefan Constantin,Alex Waibel
発行日 2023-06-20 17:58:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク