Creative Beam Search: LLM-as-a-Judge For Improving Response Generation

要約

大規模な言語モデルは、人工的な創造性を含むいくつかの分野に革命をもたらしています。
しかし、機械における生成プロセスは、人間で観察される生成プロセスとは大きく異なります。
特に、機械による生成は、意図性の欠如とその根底にある創造的なプロセスが特徴です。
我々は、Diverse Beam SearchとLLM-as-a-Judgeを使用して応答生成と応答検証を実行するCreative Beam Searchと呼ばれる方法を提案します。
定性実験の結果は、私たちのアプローチが標準のサンプリング手法よりも優れた出力をどのように提供できるかを示しています。
また、応答検証ステップが応答生成ステップを補完する必要があることも示します。

要約(オリジナル)

Large language models are revolutionizing several areas, including artificial creativity. However, the process of generation in machines profoundly diverges from that observed in humans. In particular, machine generation is characterized by a lack of intentionality and an underlying creative process. We propose a method called Creative Beam Search that uses Diverse Beam Search and LLM-as-a-Judge to perform response generation and response validation. The results of a qualitative experiment show how our approach can provide better output than standard sampling techniques. We also show that the response validation step is a necessary complement to the response generation step.

arxiv情報

著者 Giorgio Franceschelli,Mirco Musolesi
発行日 2024-09-18 13:45:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.HC, cs.LG パーマリンク