Role-Play Zero-Shot Prompting with Large Language Models for Open-Domain Human-Machine Conversation

要約

最近、大規模言語モデル (LLM) を使用してオープンドメインの会話エージェントを作成するさまざまな方法が提案されています。
これらのモデルはユーザーの質問に答えることができますが、実際の会話ではなく、一方向の Q&A 形式になります。
特定のデータセットを微調整してスタイルを変更し、会話能力を向上させるのが一般的な方法ですが、これには費用がかかり、通常は少数の言語でしか利用できません。
この研究では、指示に従うように訓練された有能な多言語 LLM (Beeching et al., 2023) を使用して、オープンドメインの会話のための効率的かつ費用対効果の高いソリューションとして、ロールプレイによるゼロショット プロンプトを検討します。
私たちは、指示に従うモデル (ここでは Vicuna (Chiang et al., 2023)) と組み合わせると、2 つの異なるタスクにおけるフランス語での人間の評価における微調整モデルに匹敵し、さらにはそれを上回る会話エージェントを生成するプロンプト システムを設計します。

要約(オリジナル)

Recently, various methods have been proposed to create open-domain conversational agents with Large Language Models (LLMs). These models are able to answer user queries, but in a one-way Q&A format rather than a true conversation. Fine-tuning on particular datasets is the usual way to modify their style to increase conversational ability, but this is expensive and usually only available in a few languages. In this study, we explore role-play zero-shot prompting as an efficient and cost-effective solution for open-domain conversation, using capable multilingual LLMs (Beeching et al., 2023) trained to obey instructions. We design a prompting system that, when combined with an instruction-following model – here Vicuna (Chiang et al., 2023) – produces conversational agents that match and even surpass fine-tuned models in human evaluation in French in two different tasks.

arxiv情報

著者 Ahmed Njifenjou,Virgile Sucal,Bassam Jabaian,Fabrice Lefèvre
発行日 2024-06-26 16:10:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.HC パーマリンク