Improving Structural Diversity of Blackbox LLMs via Chain-of-Specification Prompting


多様なテキストを生成する機能は、大規模言語モデル (LLM) が直面する重要な課題です。
これまで、多様性は $n$-gram の多様性や BERT 埋め込みの多様性などの指標を通じて研究されてきました。
さらに、我々は、最初に LLM に構造的特徴の 1 つのインスタンスをエンコードする仕様を生成させ、次に LLM にこれらの特徴を満たすテキストを生成するよう促すことで、多様性の向上を促す仕様連鎖 (CoS) と呼ばれる新しい戦略を提案します。
特に、私たちの戦略はブラックボックス LLM で機能します。
私たちの実験では、詩とコードのドメインの構造的多様性に関して、CoS がいくつかのベースラインと比較して多様性を大幅に改善することを示しました。


The capability to generate diverse text is a key challenge facing large language models (LLMs). Thus far, diversity has been studied via metrics such as $n$-gram diversity or diversity of BERT embeddings. However, for these kinds of diversity, the user has little control over the dimensions along which diversity is considered. For example, in the poetry domain, one might desire diversity in terms of rhyme and meter, whereas in the code domain, one might desire diversity in terms of the kinds of expressions used to solve a problem. We propose a diversity metric called structural diversity, where the user provides a mapping from generated text to features capturing the kinds of diversity that they care about. In addition, we propose a novel strategy called chain-of-specification (CoS) prompting for improving diversity by first having the LLM generate a specification encoding one instance of structural features, and then prompting the LLM to generate text that satisfies these features; notably, our strategy works with blackbox LLMs. In our experiments, we show that for structural diversity in the poetry and code domains, CoS significantly improves diversity compared to several baselines.


著者 Halley Young,Yimeng Zeng,Jacob Gardner,Osbert Bastani
発行日 2024-08-12 14:34:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CL, cs.LG パーマリンク