要約
これまでの質問と回答のペア生成方法は、流暢で意味のある質問と回答のペアを生成することを目的としていましたが、多様性が乏しい傾向がありました。
この問題に対処する最近の試みは、モデルの容量が低いか、アーキテクチャが複雑になりすぎるという問題に悩まされています。
さらに、彼らはモデルの制御性が入力に大きく依存するという問題を見落としていました。
この論文では、エンコーダとデコーダとして共有バックボーン ネットワークを備えた変分オートエンコーダ フレームワークを活用することにより、生成多様性を強化する VOLTA という名前のモデルを提案します。
さらに、生成プロセス全体にわたって入力に依存しない制御を可能にするために、InfoGAN スタイルの潜在コードを追加することを提案します。
私たちは包括的な実験を実施し、その結果、私たちのアプローチが最先端のモデルよりも多様性と制御性を大幅に向上できることがわかりました。
要約(オリジナル)
Previous question-answer pair generation methods aimed to produce fluent and meaningful question-answer pairs but tend to have poor diversity. Recent attempts addressing this issue suffer from either low model capacity or overcomplicated architecture. Furthermore, they overlooked the problem where the controllability of their models is highly dependent on the input. In this paper, we propose a model named VOLTA that enhances generative diversity by leveraging the Variational Autoencoder framework with a shared backbone network as its encoder and decoder. In addition, we propose adding InfoGAN-style latent codes to enable input-independent controllability over the generation process. We perform comprehensive experiments and the results show that our approach can significantly improve diversity and controllability over state-of-the-art models.
arxiv情報
著者 | Yueen Ma,Dafeng Chi,Jingjing Li,Yuzheng Zhuang,Jianye Hao,Irwin King |
発行日 | 2023-07-03 08:45:42+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google