PicPersona-TOD : A Dataset for Personalizing Utterance Style in Task-Oriented Dialogue with Image Persona

要約

タスク指向のダイアログ(TOD)システムは、自然言語の相互作用を通じてユーザー要求を満たすように設計されていますが、既存のシステムは、個性を欠いてユーザーの個人属性に適応できない一般的な単調な応答を生成することがよくあります。
これに対処するために、ペルソナの一部としてユーザー画像を組み込んだ新しいデータセットであるPicpersona-Todを紹介し、年齢や感情的なコンテキストなどのユーザー固有の要因に合わせたパーソナライズされた応答を可能にします。
これは、第一印象、対話の政策誘導プロンプト、および幻覚を減らすための外部知識の使用によって促進されます。
人間の評価は、データセットがユーザーエクスペリエンスを向上させ、より魅力的な相互作用に貢献するパーソナライズされた応答があることを確認しています。
さらに、応答をパーソナライズするだけでなく、目に見えないドメインhttps://github.com/jihyunlee1/picpersonaで堅牢なパフォーマンスを実証する新しいNLGモデルであるPictorを紹介します。

要約(オリジナル)

Task-Oriented Dialogue (TOD) systems are designed to fulfill user requests through natural language interactions, yet existing systems often produce generic, monotonic responses that lack individuality and fail to adapt to users’ personal attributes. To address this, we introduce PicPersona-TOD, a novel dataset that incorporates user images as part of the persona, enabling personalized responses tailored to user-specific factors such as age or emotional context. This is facilitated by first impressions, dialogue policy-guided prompting, and the use of external knowledge to reduce hallucinations. Human evaluations confirm that our dataset enhances user experience, with personalized responses contributing to a more engaging interaction. Additionally, we introduce a new NLG model, Pictor, which not only personalizes responses, but also demonstrates robust performance across unseen domains https://github.com/JihyunLee1/PicPersona.

arxiv情報

著者 Jihyun Lee,Yejin Jeon,Seungyeon Seo,Gary Geunbae Lee
発行日 2025-04-24 09:15:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク