要約
最近の論文では、高速収束を約束する MCMC アルゴリズムのパラダイムである勾配ベースのサンプリング アルゴリズムを適用することにより、エネルギーベースのテキスト生成の可能性が実証されました。
ただし、この論文で示したように、テキスト生成に対するこのアプローチに関するこれまでの試みはすべて、ターゲット言語モデルの配布から正しくサンプリングできませんでした。
この制限に対処するために、忠実なテキスト サンプラー、つまりターゲット テキストの分布を制限分布として持つテキスト サンプラーを設計するという問題を検討します。
ターゲットのエネルギーベースのテキスト分布から正しくサンプリングし、その理論的特性を研究するために、いくつかの忠実な勾配ベースのサンプリング アルゴリズムを提案します。
さまざまな形式のテキスト生成に関する実験を通じて、忠実なサンプラーが制御目標をより適切に遵守しながら、より流暢なテキストを生成できることを実証しました。
要約(オリジナル)
Recent papers have demonstrated the possibility of energy-based text generation by adapting gradient-based sampling algorithms, a paradigm of MCMC algorithms that promises fast convergence. However, as we show in this paper, previous attempts on this approach to text generation all fail to sample correctly from the target language model distributions. To address this limitation, we consider the problem of designing text samplers that are faithful, meaning that they have the target text distribution as its limiting distribution. We propose several faithful gradient-based sampling algorithms to sample from the target energy-based text distribution correctly, and study their theoretical properties. Through experiments on various forms of text generation, we demonstrate that faithful samplers are able to generate more fluent text while adhering to the control objectives better.
arxiv情報
| 著者 | Li Du,Afra Amini,Lucas Torroba Hennigen,Xinyan Velocity Yu,Jason Eisner,Holden Lee,Ryan Cotterell |
| 発行日 | 2023-12-29 18:00:56+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google