Think or Step-by-Step? UnZIPping the Black Box in Zero-Shot Prompts

要約

ゼロショットプロンプト技術により、大規模な言語モデル(LLMS)のパフォーマンスが大幅に向上しました。
ただし、ゼロショットプロンプトが非常に効果的である理由を明確に理解していません。
たとえば、プロンプトの「ステップバイステップ」で、「Think」または「段階的な」成功にとってより重要ですか?
勾配ベースのアプローチや注意ベースのアプローチなどの既存の解釈可能性方法は、計算的に集中的であり、オープンソースモデルに限定されています。
系統的入力ワード摂動に基づいて、オープンおよびクローズドソースモデルの両方に適用可能な多用途のメトリックであるZIPスコア(摂動スコアのゼロショットの重要性)を導入します。
最近の4つのLLMS、7つの広く使用されているプロンプト、およびいくつかのタスクにわたる実験は、単語の重要性の興味深いパターンを明らかにしています。
たとえば、「ステップバイステップ」と「Think」の両方が高いZIPスコアを示しますが、より影響力のあるZIPスコアはモデルとタスクに依存します。
制御された実験を使用して方法を検証し、結果を人間の判断と比較し、独自のモデルが単語の重要性に関する人間の直観とより密接に整合することを発見します。
これらの調査結果は、LLMの行動の理解を高め、より効果的なゼロショットプロンプトの開発とモデル分析の改善に貢献します。

要約(オリジナル)

Zero-shot prompting techniques have significantly improved the performance of Large Language Models (LLMs). However, we lack a clear understanding of why zero-shot prompts are so effective. For example, in the prompt ‘Let’s think step-by-step,’ is ‘think’ or ‘step-by-step’ more crucial to its success? Existing interpretability methods, such as gradient-based and attention-based approaches, are computationally intensive and restricted to open-source models. We introduce the ZIP score (Zero-shot Importance of Perturbation score), a versatile metric applicable to both open and closed-source models, based on systematic input word perturbations. Our experiments across four recent LLMs, seven widely-used prompts, and several tasks, reveal interesting patterns in word importance. For instance, while both ‘step-by-step’ and ‘think’ show high ZIP scores, which one is more influential depends on the model and task. We validate our method using controlled experiments and compare our results with human judgments, finding that proprietary models align more closely with human intuition regarding word significance. These findings enhance our understanding of LLM behavior and contribute to developing more effective zero-shot prompts and improved model analysis.

arxiv情報

著者 Nikta Gohari Sadr,Sangmitra Madhusudan,Ali Emami
発行日 2025-02-05 18:04:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク