Permute-and-Flip: An optimally robust and watermarkable decoder for LLMs

要約

本稿では、Permute-and-Flip (PF) デコーダと呼ばれる新しいデコード方法を提案します。
標準のサンプリング デコーダと同様の堅牢性特性を備えていますが、品質と堅牢性のトレードオフではサンプリングよりも最大 2 倍優れており、他のデコーダよりも劣ることはありません。
また、Aaronson の Gumbel 透かしに似た暗号透かしスキームも設計しますが、当然のことながら PF デコーダ用に調整されています。
透かし入れスキームは、サンプルへの分布を変更せず、生成されたテキストのエントロピーが高い場合は常に、任意に低い偽陽性率と高い再現率を可能にします。
私たちの実験では、PF デコーダ (およびその透かし入りの対応物) が、同じ堅牢性 (および検出可能性) を維持しながら、複雑さの点でナイーブ サンプリング (およびガンベルの透かし入りの対応物) よりも大幅に優れていることが示されており、したがって、PF デコーダが有望な新しいアプローチとなることがわかりました。
LLMデコード。
コードは https://github.com/XuandongZhao/pf-decoding で入手できます。

要約(オリジナル)

In this paper, we propose a new decoding method called Permute-and-Flip (PF) decoder. It enjoys robustness properties similar to the standard sampling decoder, but is provably up to 2x better in its quality-robustness tradeoff than sampling and never worse than any other decoder. We also design a cryptographic watermarking scheme analogous to Aaronson’s Gumbel watermark, but naturally tailored for PF decoder. The watermarking scheme does not change the distribution to sample, while allowing arbitrarily low false positive rate and high recall whenever the generated text has high entropy. Our experiments show that the PF decoder (and its watermarked counterpart) significantly outperform(s) naive sampling (and it’s Gumbel watermarked counterpart) in terms of perplexity, while retaining the same robustness (and detectability), hence making it a promising new approach for LLM decoding. The code is available at https://github.com/XuandongZhao/pf-decoding

arxiv情報

著者 Xuandong Zhao,Lei Li,Yu-Xiang Wang
発行日 2024-02-08 17:54:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.CR, cs.LG パーマリンク