Read the Room: Adapting a Robot’s Voice to Ambient and Social Contexts


私たちのアプローチには 3 つのステップが含まれます: (a) 仮想 Zoom アンビエンスで音声データ インタラクションを収集および検証する、(b) 人間の音声発話を探索およびクラスタリングして主要な音声スタイルを特定する、(c) 投影、照明を使用して再現されたアンビエンスでロボットの音声スタイルをテストする
私たちは、状況に応じて適切かつ適応的な方法で話すロボットに向けて、さまざまなスタイルの Pepper ロボットの音声を使用した結果を提供します。
N=120 人の参加者を対象とした結果は、さまざまな環境における音声スタイルの選択が、社会的適切性、快適さ、意識、人間らしさ、能力などのいくつかの要素においてロボットの知覚知性に影響を与えるという証拠を示しています。


How should a robot speak in a formal, quiet and dark, or a bright, lively and noisy environment? By designing robots to speak in a more social and ambient-appropriate manner we can improve perceived awareness and intelligence for these agents. We describe a process and results toward selecting robot voice styles for perceived social appropriateness and ambiance awareness. Understanding how humans adapt their voices in different acoustic settings can be challenging due to difficulties in voice capture in the wild. Our approach includes 3 steps: (a) Collecting and validating voice data interactions in virtual Zoom ambiances, (b) Exploration and clustering human vocal utterances to identify primary voice styles, and (c) Testing robot voice styles in recreated ambiances using projections, lighting and sound. We focus on food service scenarios as a proof-of-concept setting. We provide results using the Pepper robot’s voice with different styles, towards robots that speak in a contextually appropriate and adaptive manner. Our results with N=120 participants provide evidence that the choice of voice style in different ambiances impacted a robot’s perceived intelligence in several factors including: social appropriateness, comfort, awareness, human-likeness and competency.


著者 Paige Tuttosi,Emma Hughson,Akihiro Matsufuji,Angelica Lim
発行日 2023-09-21 14:55:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.RO パーマリンク