Creative Beam Search: LLM-as-a-Judge For Improving Response Generation

要約

大規模な言語モデルは、人工的な創造性を含むいくつかの分野に革命をもたらしている。しかし、機械における生成プロセスは、人間で観察されるものとは大きく異なっている。特に、機械による生成は、意図性の欠如と、根底にある創造的プロセスの欠如を特徴とする。我々は、多様なビーム探索とLLM-as-a-Judgeを用いて応答生成と応答検証を行う、創造的ビーム探索と呼ばれる手法を提案する。質的実験の結果から、我々の手法が標準的なサンプリング手法よりもいかに優れたアウトプットを提供できるかを示す。また、応答検証ステップは応答生成ステップを補完するために必要であることも示す。

要約(オリジナル)

Large language models are revolutionizing several areas, including artificial creativity. However, the process of generation in machines profoundly diverges from that observed in humans. In particular, machine generation is characterized by a lack of intentionality and an underlying creative process. We propose a method called Creative Beam Search that uses Diverse Beam Search and LLM-as-a-Judge to perform response generation and response validation. The results of a qualitative experiment show how our approach can provide better output than standard sampling techniques. We also show that the response validation step is a necessary complement to the response generation step.

arxiv情報

著者 Giorgio Franceschelli,Mirco Musolesi
発行日 2024-10-07 16:45:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CL, cs.HC, cs.LG パーマリンク