Leveraging Graph Structures and Large Language Models for End-to-End Synthetic Task-Oriented Dialogues

要約

タスク指向の対話システムのトレーニングには、さまざまな意図を含む高品質のデータセットが必要なため、コストと時間がかかります。
従来の方法は人間による広範な注釈に依存していましたが、最近の進歩では大規模言語モデル (LLM) を活用して合成データを生成しています。
ただし、これらのアプローチではカスタム プロンプトやコードが必要になることが多く、技術者以外のユーザーのアクセシビリティが制限されます。
タスク指向のダイアログの生成を簡素化するエンドツーエンドのフレームワークである GraphTOD を紹介します。
遷移グラフをJSON形式で指定することでダイアログを作成できます。
私たちの評価では、GraphTOD がさまざまなドメインにわたって高品質のダイアログを生成し、データセット作成のコストと複雑さを大幅に削減することが実証されました。

要約(オリジナル)

Training task-oriented dialogue systems is both costly and time-consuming, due to the need for high-quality datasets encompassing diverse intents. Traditional methods depend on extensive human annotation, while recent advancements leverage large language models (LLMs) to generate synthetic data. However, these approaches often require custom prompts or code, limiting accessibility for non-technical users. We introduce GraphTOD, an end-to-end framework that simplifies the generation of task-oriented dialogues. Users can create dialogues by specifying transition graphs in JSON format. Our evaluation demonstrates that GraphTOD generates high-quality dialogues across various domains, significantly lowering the cost and complexity of dataset creation.

arxiv情報

著者 Maya Medjad,Hugo Imbert,Bruno Yun,Raphaël Szymocha,Frédéric Armetta
発行日 2025-01-21 08:51:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク