Error correction and extraction in request dialogs

要約

タイトル:リクエストダイアログにおけるエラー訂正と抽出
要約:
– ユーザーの最後のスピーチとその前のスピーチの2つを取得し、最後のスピーチが前のスピーチのエラー訂正であるかどうかを検出し、エラー訂正に基づいて前のスピーチを訂正するダイアログシステムのユーティリティコンポーネントを提供する。
– このコンポーネントにより、新しいドメインのエラー訂正を収集する必要を避けることができ、さらにはリペアラテラルとリペアエンティティのペアを抽出することができます。
– エラー訂正には、1つのシークエンスラベリングと2つのシークエンスツーシークエンスアプローチがあります。
– エラー訂正検出には、これらの3つのエラー訂正アプローチを使用でき、さらに、シークエンス分類アプローチを提供します。
– 修復エンティティフレーズの修復のためのアプローチを評価するために、EPIC-KITCHENS-100データセットを修正しました。
– エラー訂正検出と訂正に対して、合成バリデーションデータで96.40%、人間が作成した実世界のテストデータで77.85%の正確性を得ました。

要約(オリジナル)

We propose a dialog system utility component that gets the two last utterances of a user and can detect whether the last utterance is an error correction of the second last utterance. If yes, it corrects the second last utterance according to the error correction in the last utterance. In addition, the proposed component outputs the extracted pairs of reparandum and repair entity. This component offers two advantages, learning the concept of corrections to avoid collecting corrections for every new domain and extracting reparandum and repair pairs, which offers the possibility to learn out of it. For the error correction one sequence labeling and two sequence to sequence approaches are presented. For the error correction detection these three error correction approaches can also be used and in addition, we present a sequence classification approach. One error correction detection and one error correction approach can be combined to a pipeline or the error correction approaches can be trained and used end-to-end to avoid two components. We modified the EPIC-KITCHENS-100 dataset to evaluate the approaches for correcting entity phrases in request dialogs. For error correction detection and correction, we got an accuracy of 96.40 % on synthetic validation data and an accuracy of 77.85 % on human-created real-world test data.

arxiv情報

著者 Stefan Constantin,Alex Waibel
発行日 2023-05-01 15:42:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL パーマリンク