ChatGPT as Data Augmentation for Compositional Generalization: A Case Study in Open Intent Detection


自然言語理解の重要な側面であるオープン インテントの検出には、ユーザーが生成したテキスト内のこれまで目に見えなかったインテントの識別が含まれます。
この論文では、オープンインテント検出タスクにおける構成的一般化を強化するためのデータ拡張手法として ChatGPT の使用を検討するケーススタディを紹介します。
ChatGPT によって生成された合成データをトレーニング プロセスに組み込むことで、私たちのアプローチがモデルのパフォーマンスを効果的に向上できることを実証します。
私たちの調査結果は、自然言語理解タスクにおけるデータ拡張に対する ChatGPT のような大規模言語モデルの可能性を強調しています。


Open intent detection, a crucial aspect of natural language understanding, involves the identification of previously unseen intents in user-generated text. Despite the progress made in this field, challenges persist in handling new combinations of language components, which is essential for compositional generalization. In this paper, we present a case study exploring the use of ChatGPT as a data augmentation technique to enhance compositional generalization in open intent detection tasks. We begin by discussing the limitations of existing benchmarks in evaluating this problem, highlighting the need for constructing datasets for addressing compositional generalization in open intent detection tasks. By incorporating synthetic data generated by ChatGPT into the training process, we demonstrate that our approach can effectively improve model performance. Rigorous evaluation of multiple benchmarks reveals that our method outperforms existing techniques and significantly enhances open intent detection capabilities. Our findings underscore the potential of large language models like ChatGPT for data augmentation in natural language understanding tasks.


著者 Yihao Fang,Xianzhi Li,Stephen W. Thomas,Xiaodan Zhu
発行日 2023-08-25 17:51:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CL パーマリンク