Turning Flowchart into Dialog: Augmenting Flowchart-grounded Troubleshooting Dialogs via Synthetic Data Generation

要約

フローチャートに基づいたトラブルシューティング対話 (FTD) システムは、フローチャートの指示に従って特定の領域 (車両、ラップトップなど) におけるユーザーの問題を診断するもので、近年研究上の関心を集めています。
ただし、フローチャートに基づいた十分な対話を収集するにはコストがかかるため、FTD システムはトレーニング データが不足しているために妨げられています。
データの希薄性の問題を軽減するために、簡潔なフローチャートをダイアログに変換することで多様な合成ダイアログ データを大規模に生成する、プランベースの合成データ生成 (PlanSDG) アプローチを提案します。
具体的には、その生成モデルは、グローバルおよびローカルの潜在計画変数を含む階層計画戦略を備えた変分ベースのフレームワークを採用しています。
FloDial データセットの実験では、PlanSDG によって生成された合成対話により、特にフローチャート外設定でのフローチャート パスの取得や応答生成などの下流タスクのパフォーマンスが向上することが示されています。
さらに、さらなる分析により、現在のサンプル ダイアログでカバーされているパスとカバーされていないパスで PlanSDG によって生成された合成データの品質が実証されます。

要約(オリジナル)

Flowchart-grounded troubleshooting dialogue (FTD) systems, which follow the instructions of a flowchart to diagnose users’ problems in specific domains (e.g., vehicle, laptop), have been gaining research interest in recent years. However, collecting sufficient dialogues that are naturally grounded on flowcharts is costly, thus FTD systems are impeded by scarce training data. To mitigate the data sparsity issue, we propose a plan-based synthetic data generation (PlanSDG) approach that generates diverse synthetic dialog data at scale by transforming concise flowchart into dialogues. Specifically, its generative model employs a variational-base framework with a hierarchical planning strategy that includes global and local latent planning variables. Experiments on the FloDial dataset show that synthetic dialogue produced by PlanSDG improves the performance of downstream tasks, including flowchart path retrieval and response generation, in particular on the Out-of-Flowchart settings. In addition, further analysis demonstrate the quality of synthetic data generated by PlanSDG in paths that are covered by current sample dialogues and paths that are not covered.

arxiv情報

著者 Haolan Zhan,Sameen Maruf,Lizhen Qu,Yufei Wang,Ingrid Zukerman,Gholamreza Haffari
発行日 2023-10-29 11:02:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク