Stay on topic with Classifier-Free Guidance

要約

Classifier-Free Guide (CFG) は、世代間の即時遵守を促進する軽量技術として、テキストから画像への生成において最近登場しました。
この研究では、CFG が純粋言語モデリングにおける推論時の手法として広く使用できることを示します。
CFG (1) が Q&A、推論、コード生成、機械翻訳といった一連のタスクにわたって Pythia、GPT-2、LLaMA ファミリー モデルのパフォーマンスを向上させ、PaLM 上で LLaMA-7B を使用した LAMBADA 上の SOTA を達成することを示します。
-540B;
(2) パラメータ数が 2 倍のモデルと同等の改善をもたらします。
(3) 思考連鎖や自己一貫性などの他の推論時手法と併用して、困難なタスクをさらに改善できます。
(4) 困難なフォーム主導型およびコンテンツ主導型のプロンプトにおけるアシスタントの忠実性と一貫性を高めるために使用できます。人間による評価では、CFG を使用する GPT4All がベースラインより 75% 優先されることがわかりました。

要約(オリジナル)

Classifier-Free Guidance (CFG) has recently emerged in text-to-image generation as a lightweight technique to encourage prompt-adherence in generations. In this work, we demonstrate that CFG can be used broadly as an inference-time technique in pure language modeling. We show that CFG (1) improves the performance of Pythia, GPT-2 and LLaMA-family models across an array of tasks: Q\&A, reasoning, code generation, and machine translation, achieving SOTA on LAMBADA with LLaMA-7B over PaLM-540B; (2) brings improvements equivalent to a model with twice the parameter-count; (3) can stack alongside other inference-time methods like Chain-of-Thought and Self-Consistency, yielding further improvements in difficult tasks; (4) can be used to increase the faithfulness and coherence of assistants in challenging form-driven and content-driven prompts: in a human evaluation we show a 75\% preference for GPT4All using CFG over baseline.

arxiv情報

著者 Guillaume Sanchez,Honglu Fan,Alexander Spangher,Elad Levi,Pawan Sasanka Ammanamanchi,Stella Biderman
発行日 2023-06-30 17:07:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.CV, cs.LG パーマリンク