要約
不完全な発話書き換え(IUR)に関する以前の研究は、対話の広範な現象を無視して、対話の広範な現象を無視して、対話の文脈のみに基づいて書き直された発話を生成することに主に焦点を当てています。
この問題に対処するために、第1段階で編集操作を生成し、生成された編集操作とダイアログコンテキストを利用して不完全な発話を書き直すIURのTEO(\ emph {編集操作に関する2段階のアプローチ})という新しいフレームワークを提案します。
さらに、第2段階でのトレーニングと推論の間の矛盾によって引き起こされるカスケードエラーと暴露バイアスを軽減するために、敵対的な摂動戦略が提案されています。
3つのIURデータセットの実験結果は、TEOがSOTAモデルを大幅に上回ることを示しています。
要約(オリジナル)
Previous work on Incomplete Utterance Rewriting (IUR) has primarily focused on generating rewritten utterances based solely on dialogue context, ignoring the widespread phenomenon of coreference and ellipsis in dialogues. To address this issue, we propose a novel framework called TEO (\emph{Two-stage approach on Editing Operation}) for IUR, in which the first stage generates editing operations and the second stage rewrites incomplete utterances utilizing the generated editing operations and the dialogue context. Furthermore, an adversarial perturbation strategy is proposed to mitigate cascading errors and exposure bias caused by the inconsistency between training and inference in the second stage. Experimental results on three IUR datasets show that our TEO outperforms the SOTA models significantly.
arxiv情報
著者 | Zhiyu Cao,Peifeng Li,Qiaoming Zhu,Yaxin Fan |
発行日 | 2025-03-20 11:56:14+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google