Imitation of human motion achieves natural head movements for humanoid robots in an active-speaker detection task


生成 AI モデルによる人間の動きのモデリングは、近年ロボット工学の分野で活発な研究分野となっていますが、人間とロボットの相互作用において頭部の動きを生成するためのこれらの方法の使用は、依然として十分に研究されていません。
この作業では、生成 AI パイプラインを使用して、Nao ヒューマノイド ロボットの人間のような頭の動きを生成しました。
全体として、結果は、Nao ロボットが会話中に話者を積極的に追跡しながら、人間の頭の動きを自然な方法でうまく模倣していることを示しています。
この研究のコードとデータは、 で入手できます。


Head movements are crucial for social human-human interaction. They can transmit important cues (e.g., joint attention, speaker detection) that cannot be achieved with verbal interaction alone. This advantage also holds for human-robot interaction. Even though modeling human motions through generative AI models has become an active research area within robotics in recent years, the use of these methods for producing head movements in human-robot interaction remains underexplored. In this work, we employed a generative AI pipeline to produce human-like head movements for a Nao humanoid robot. In addition, we tested the system on a real-time active-speaker tracking task in a group conversation setting. Overall, the results show that the Nao robot successfully imitates human head movements in a natural manner while actively tracking the speakers during the conversation. Code and data from this study are available at


著者 Bosong Ding,Murat Kirtay,Giacomo Spigler
発行日 2024-07-16 17:08:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク