Structured Voronoi Sampling

要約

勾配ベースのサンプリング アルゴリズムは、テキスト生成、特に制御されたテキスト生成のコンテキストにおいてその有効性を実証しています。
しかし、この課題に対する理論的根拠と原則に基づいたアプローチが不足しています。
このペーパーでは、勾配ベースの方法を使用して言語モデルからサンプリングするための原則に基づいたアプローチの構築に向けた重要な一歩を踏み出します。
言語モデルによって与えられる離散分布を使用して密度を定義し、そこからサンプリングするためのハミルトニアン モンテカルロに基づくアルゴリズムを開発します。
勾配ベースの手法を構造化ボロノイ サンプリング (SVS) と名付けます。
基準分布がわかっている実験設定では、SVS サンプルの経験的分布が、代替サンプリング スキームと比較して基準分布に近いことを示します。
さらに、制御された生成タスクでは、SVS は他の方法よりもはるかに優れた制御ターゲットに従いながら、流暢で多様なサンプルを生成できます。

要約(オリジナル)

Gradient-based sampling algorithms have demonstrated their effectiveness in text generation, especially in the context of controlled text generation. However, there exists a lack of theoretically grounded and principled approaches for this task. In this paper, we take an important step toward building a principled approach for sampling from language models with gradient-based methods. We use discrete distributions given by language models to define densities and develop an algorithm based on Hamiltonian Monte Carlo to sample from them. We name our gradient-based technique Structured Voronoi Sampling (SVS). In an experimental setup where the reference distribution is known, we show that the empirical distribution of SVS samples is closer to the reference distribution compared to alternative sampling schemes. Furthermore, in a controlled generation task, SVS is able to generate fluent and diverse samples while following the control targets significantly better than other methods.

arxiv情報

著者 Afra Amini,Li Du,Ryan Cotterell
発行日 2023-12-13 18:18:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク