要約
意図誘導における最先端のモデルには、注釈付きのデータセットが必要です。
ただし、ダイアログに注釈を付けるには時間と労力がかかり、費用もかかります。
この研究では、対話内での意図誘導のための完全に教師なしのフレームワークを提案します。
さらに、対話コーパスを前処理することで結果がどのように改善されるかを示します。
最後に、最も一般的なシーケンスを調査することで、意図の対話フローを抽出する方法を示します。
私たちは MultiWOZ データセットで作業をテストしていますが、このフレームワークは事前知識を必要としないため、考えられるあらゆるユースケースに適用でき、業界全体の実際のカスタマー サポート アプリケーションに非常に関連性があります。
要約(オリジナル)
State of the art models in intent induction require annotated datasets. However, annotating dialogues is time-consuming, laborious and expensive. In this work, we propose a completely unsupervised framework for intent induction within a dialogue. In addition, we show how pre-processing the dialogue corpora can improve results. Finally, we show how to extract the dialogue flows of intentions by investigating the most common sequences. Although we test our work in the MultiWOZ dataset, the fact that this framework requires no prior knowledge make it applicable to any possible use case, making it very relevant to real world customer support applications across industry.
arxiv情報
著者 | Rita Costa,Bruno Martins,Sérgio Viana,Luisa Coheur |
発行日 | 2023-07-28 09:03:14+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google