Prompting a Large Language Model to Generate Diverse Motivational Messages: A Comparison with Human-Written Messages

要約

大規模言語モデル (LLM) はますます高機能で普及しており、クリエイティブなコンテンツの作成に使用できるようになりました。
コンテンツの品質は使用されるプロンプトに影響され、例を組み込んだより具体的なプロンプトは一般的により良い結果をもたらします。
このことから、クラウドソーシングのタスク用に書かれた指示 (具体的で、作業者をガイドするための例が含まれている) を使用すると、LLM プロンプトが効果的であることが証明される可能性があることがわかります。
これを調査するために、私たちは以前のクラウドソーシング パイプラインを使用して、人々に動機付けのメッセージの集合的に多様なコーパスを生成するのに役立つ例を提供しました。
次に、この同じパイプラインを使用して、GPT-4 を使用してメッセージを生成し、(1) クラウドライター、(2) パイプラインを使用した GPT-4、および (3 & 4) 2 つのベースライン GPT-4 からのメッセージの集合的な多様性を比較しました。
4つのプロンプト。
クラウドソーシング パイプラインを使用した LLM プロンプトにより、GPT-4 が 2 つのベースライン プロンプトよりも多様なメッセージを生成することがわかりました。
また、人間の作成者と LLM の両方によって生成されたメッセージからの影響についても説明します。

要約(オリジナル)

Large language models (LLMs) are increasingly capable and prevalent, and can be used to produce creative content. The quality of content is influenced by the prompt used, with more specific prompts that incorporate examples generally producing better results. On from this, it could be seen that using instructions written for crowdsourcing tasks (that are specific and include examples to guide workers) could prove effective LLM prompts. To explore this, we used a previous crowdsourcing pipeline that gave examples to people to help them generate a collectively diverse corpus of motivational messages. We then used this same pipeline to generate messages using GPT-4, and compared the collective diversity of messages from: (1) crowd-writers, (2) GPT-4 using the pipeline, and (3 & 4) two baseline GPT-4 prompts. We found that the LLM prompts using the crowdsourcing pipeline caused GPT-4 to produce more diverse messages than the two baseline prompts. We also discuss implications from messages generated by both human writers and LLMs.

arxiv情報

著者 Samuel Rhys Cox,Ashraf Abdul,Wei Tsang Ooi
発行日 2023-08-25 16:35:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.HC パーマリンク