要約
タイトル:フローチャートを対話に変換する:低リソースなフローチャートに基づくトラブルシューティング対話の計画ベースのデータ拡張
要約:
– FTDシステムは、特定のドメイン(車、ノートパソコンなど)のフローチャートに従って、ユーザーの問題を診断するための対話システムである。
– フローチャートに基づくトラブルシューティング対話システム(FTD)は、様々な研究で注目を集めている。
– しかし、フローチャートに自然に基づいた対話を収集することはコストがかかるので、FTDシステムは希少なトレーニングデータによって制限されている。
– データの希少性の問題を緩和するために、計画ベースのデータ拡張(PlanDA)アプローチを提案する。
– PlanDAアプローチは、コンパクトなフローチャートを対話に変換することで、多様な合成対話データを大規模に生成する。
– 様々な実験(FloDialデータセット)により、PlanDAが生成した合成対話は、フローチャートパスの検索や返答生成などのダウンストリームタスクのパフォーマンスを向上させることがわかった。
– さらに分析により、PlanDAによって生成された合成データの品質が、現在のサンプル対話でカバーされているパスやカバーされていないパスで高いことが示された。
要約(オリジナル)
Flowchart-grounded troubleshooting dialogue (FTD) systems, which follow the instructions of a flowchart to diagnose users’ problems in specific domains (eg., vehicle, laptop), have been gaining research interest in recent years. However, collecting sufficient dialogues that are naturally grounded on flowcharts is costly, thus FTD systems are impeded by scarce training data. To mitigate the data sparsity issue, we propose a plan-based data augmentation (PlanDA) approach that generates diverse synthetic dialog data at scale by transforming concise flowchart into dialogues. Specifically, its generative model employs a variational-base framework with a hierarchical planning strategy that includes global and local latent planning variables. Experiments on the FloDial dataset show that synthetic dialogue produced by PlanDA improves the performance of downstream tasks, including flowchart path retrieval and response generation, in particular on the Out-of-Flowchart settings. In addition, further analysis demonstrate the quality of synthetic data generated by PlanDA in paths that are covered by current sample dialogues and paths that are not covered.
arxiv情報
著者 | Haolan Zhan,Sameen Maruf,Lizhen Qu,Yufei Wang,Ingrid Zukerman,Gholamreza Haffari |
発行日 | 2023-05-10 00:57:07+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI