Leveraging Graph Structures and Large Language Models for End-to-End Synthetic Task-Oriented Dialogues


従来の方法は人間による広範な注釈に依存していましたが、最近の進歩では大規模言語モデル (LLM) を活用して合成データを生成しています。
ただし、これらのアプローチではカスタム プロンプトやコードが必要になることが多く、技術者以外のユーザーのアクセシビリティが制限されます。
タスク指向のダイアログの生成を簡素化するエンドツーエンドのフレームワークである GraphTOD を紹介します。
私たちの評価では、GraphTOD がさまざまなドメインにわたって高品質のダイアログを生成し、データセット作成のコストと複雑さを大幅に削減することが実証されました。


Training task-oriented dialogue systems is both costly and time-consuming, due to the need for high-quality datasets encompassing diverse intents. Traditional methods depend on extensive human annotation, while recent advancements leverage large language models (LLMs) to generate synthetic data. However, these approaches often require custom prompts or code, limiting accessibility for non-technical users. We introduce GraphTOD, an end-to-end framework that simplifies the generation of task-oriented dialogues. Users can create dialogues by specifying transition graphs in JSON format. Our evaluation demonstrates that GraphTOD generates high-quality dialogues across various domains, significantly lowering the cost and complexity of dataset creation.


著者 Maya Medjad,Hugo Imbert,Bruno Yun,Raphaël Szymocha,Frédéric Armetta
発行日 2025-01-21 08:51:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク