要約
大規模な言語モデルに基づいて構築されたロールプレイング チャットボットが関心を集めていますが、特定の架空のキャラクターを模倣できるようにするには、より優れた技術が必要です。
私たちは、スクリプトから抽出された文字の記憶とプロンプトの改善を通じて言語モデルを制御するアルゴリズムを提案します。
私たちは、32 人の中国語/英語のテレビ/アニメのキャラクターと 54,000 を超える模擬対話をカバーするデータセットである ChatHaruhi を構築します。
自動評価と人間による評価の両方で、私たちのアプローチがロールプレイング能力をベースラインよりも向上させていることが示されています。
コードとデータは https://github.com/LC1332/Chat-Haruhi-Susumya で入手できます。
要約(オリジナル)
Role-playing chatbots built on large language models have drawn interest, but better techniques are needed to enable mimicking specific fictional characters. We propose an algorithm that controls language models via an improved prompt and memories of the character extracted from scripts. We construct ChatHaruhi, a dataset covering 32 Chinese / English TV / anime characters with over 54k simulated dialogues. Both automatic and human evaluations show our approach improves role-playing ability over baselines. Code and data are available at https://github.com/LC1332/Chat-Haruhi-Suzumiya .
arxiv情報
著者 | Cheng Li,Ziang Leng,Chenxi Yan,Junyi Shen,Hao Wang,Weishi MI,Yaying Fei,Xiaoyang Feng,Song Yan,HaoSheng Wang,Linkang Zhan,Yaokai Jia,Pingyu Wu,Haozhen Sun |
発行日 | 2023-08-18 14:50:25+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google