ConvoGen: Enhancing Conversational AI with Synthetic Data: A Multi-Agent Approach

要約

この論文では、コンボゲン:マルチエージェントシステムを使用して合成会話データを生成するための革新的なフレームワークを提示します。
私たちの方法は、少数のショット学習を活用し、動的に更新された少数のショットハブから反復的なサンプリングを導入して、多様で現実的な会話シナリオを作成します。
生成されたデータには、会話型AIモデルのトレーニングと評価、会話の意図分類や会話の要約などのタスクの既存のデータセットを強化するなど、多数のアプリケーションがあります。
私たちの実験は、高品質の多様な合成会話データを生成する際のこの方法の有効性を示しており、会話型AIシステムの開発と評価を強化する可能性を強調しています。

要約(オリジナル)

In this paper, we present ConvoGen: an innovative framework for generating synthetic conversational data using multi-agent systems. Our method leverages few-shot learning and introduces iterative sampling from a dynamically updated few-shot hub to create diverse and realistic conversational scenarios. The generated data has numerous applications, including training and evaluating conversational AI models, and augmenting existing datasets for tasks like conversational intent classification or conversation summarization. Our experiments demonstrate the effectiveness of this method in producing high-quality diverse synthetic conversational data, highlighting its potential to enhance the development and evaluation of conversational AI systems.

arxiv情報

著者 Reem Gody,Mahmoud Goudy,Ahmed Y. Tawfik
発行日 2025-05-09 14:12:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク