要約
近年、テキスト生成のための勾配に基づくサンプリングアルゴリズムの開発、特に制御された生成のためのアルゴリズムへの関心が高まっている。しかし、このタスクのための理論的に根拠があり、原理的なアプローチが不足しているのが現状である。本論文では、言語モデルから勾配に基づく手法でサンプリングするための原理的なアプローチを構築するための重要な一歩を踏み出すものである。言語モデルから得られる離散分布を用いて密度を定義し、ハミルトニアンモンテカルロに基づくアルゴリズムを開発し、そこからサンプリングする。この勾配ベースの手法をStructured Voronoi Sampling (SVS)と名付ける。基準分布が既知の実験セットアップにおいて、SVSサンプルの経験分布が、代替サンプリングスキームと比較して、基準分布に近いことを示す。さらに、制御された生成タスクにおいて、SVSは他の手法と比較して、制御目標に従いながら流暢で多様なサンプルを生成することができることを示す。
要約(オリジナル)
Recently, there has been a growing interest in the development of gradient-based sampling algorithms for text generation, especially in the context of controlled generation. However, there exists a lack of theoretically grounded and principled approaches for this task. In this paper, we take an important step toward building a principled approach for sampling from language models with gradient-based methods. We use discrete distributions given by language models to define densities and develop an algorithm based on Hamiltonian Monte Carlo to sample from them. We name our gradient-based technique Structured Voronoi Sampling (SVS). In an experimental setup where the reference distribution is known, we show that the empirical distribution of SVS samples is closer to the reference distribution compared to alternative sampling schemes. Furthermore, in a controlled generation task, SVS is able to generate fluent and diverse samples while following the control targets significantly better than other methods.
arxiv情報
| 著者 | Afra Amini,Li Du,Ryan Cotterell |
| 発行日 | 2023-06-05 17:32:35+00:00 |
| arxivサイト | arxiv_id(pdf) |