Multi-View Zero-Shot Open Intent Induction from Dialogues: Multi Domain Batch and Proxy Gradient Transfer

要約

タスク指向対話 (TOD) システムでは、新しい意図の検出と誘導が、システムを現実世界に適用するための 2 つの主な課題です。
この論文では、これら 2 つの課題を解決するためのセマンティック マルチビュー モデルを提案します。(1) 一般埋め込み (GE) のための SBERT、(2) 対話ドメイン知識のためのマルチ ドメイン バッチ (MDB)、および (3) プロキシ グラディエント転送
(PGT) クラスターに特化したセマンティクス。
MDB は、多様な対話データセットをモデルに一度にフィードし、複数のドメインの知識を学習することでマルチドメインの問題に取り組みます。
我々は、シャムネットワークを採用し、クラスタリング手法でモデルを直接微調整する新しい手法であるPGTを導入しました。我々のモデルは、PGTを使用して対話発話をクラスタリングする方法を学習できます。
実験結果は、MDB と PGT を使用したマルチビュー モデルが、ベースライン システムと比較してオープン インテント誘導のパフォーマンスを大幅に向上させることを示しています。

要約(オリジナル)

In Task Oriented Dialogue (TOD) system, detecting and inducing new intents are two main challenges to apply the system in the real world. In this paper, we suggest the semantic multi-view model to resolve these two challenges: (1) SBERT for General Embedding (GE), (2) Multi Domain Batch (MDB) for dialogue domain knowledge, and (3) Proxy Gradient Transfer (PGT) for cluster-specialized semantic. MDB feeds diverse dialogue datasets to the model at once to tackle the multi-domain problem by learning the multiple domain knowledge. We introduce a novel method PGT, which employs the Siamese network to fine-tune the model with a clustering method directly.Our model can learn how to cluster dialogue utterances by using PGT. Experimental results demonstrate that our multi-view model with MDB and PGT significantly improves the Open Intent Induction performance compared to baseline systems.

arxiv情報

著者 Hyukhun Koh,Haesung Pyun,Nakyeong Yang,Kyomin Jung
発行日 2023-08-13 15:06:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク