Multi-View Zero-Shot Open Intent Induction from Dialogues: Multi Domain Batch and Proxy Gradient Transfer


タスク指向対話 (TOD) システムでは、新しい意図を検出して誘導することが、システムを現実の世界に適用するための 2 つの主要な課題です。
このホワイト ペーパーでは、これら 2 つの課題を解決するためのセマンティック マルチビュー モデルを提案します。(1) General Embedding (GE) 用の SBERT、(2) 対話ドメインの知識用の Multi Domain Batch (MDB)、および (3) Proxy Gradient Transfer
(PGT) クラスターに特化したセマンティック。
MDB は、多様な対話データセットを一度にモデルに供給し、複数のドメインの知識を学習することでマルチドメインの問題に取り組みます。
シャム ネットワークを使用して、クラスタリング手法を使用してモデルを直接微調整する新しい方法 PGT を導入します。私たちのモデルは、PGT を使用して対話発話をクラスタ化する方法を学習できます。
実験結果は、MDB と PGT を使用したマルチビュー モデルが、ベースライン システムと比較して Open Intent Induction のパフォーマンスを大幅に向上させることを示しています。


In Task Oriented Dialogue (TOD) system, detecting and inducing new intents are two main challenges to apply the system in the real world. In this paper, we suggest the semantic multi-view model to resolve these two challenges: (1) SBERT for General Embedding (GE), (2) Multi Domain Batch (MDB) for dialogue domain knowledge, and (3) Proxy Gradient Transfer (PGT) for cluster-specialized semantic. MDB feeds diverse dialogue datasets to the model at once to tackle the multi-domain problem by learning the multiple domain knowledge. We introduce a novel method PGT, which employs the Siamese network to fine-tune the model with a clustering method directly.Our model can learn how to cluster dialogue utterances by using PGT. Experimental results demonstrate that our multi-view model with MDB and PGT significantly improves the Open Intent Induction performance compared to baseline systems.


著者 Hyukhun Koh,Haesung Pyun,Nakyeong Yang,Kyomin Jung
発行日 2023-03-23 08:30:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CL パーマリンク