要約
遠隔操作されたロボットのキャラクタは、操作者の経験や社会的直感を頼りに、人間と表情豊かなインタラクションを行うことができる。本研究では、オペレータのデータを模倣するモデルを学習することで、自律的な対話ロボットを作成することを提案する。我々のモデルは、人間とロボットのインタラクションのデータセットを用いて学習される。このデータセットでは、熟練したオペレータがロボットのインタラクションやムードを変化させるよう依頼され、オペレータのコマンドや人間とロボットのポーズが記録される。我々のアプローチは、拡散過程を通して連続的なオペレータのコマンドを予測することを学習し、分類器を通して離散的なコマンドを予測することを学習する。我々は、結果として得られたモデルを、シミュレーションと、実システムを用いたユーザースタディで評価する。本手法により、専門家とオペレータのベースラインと同等の簡単な自律的な人間とロボットのインタラクションが可能になること、また、本モデルにより生成されたロボットの様々な気分をユーザが認識できることを示す。最後に、我々のモデルを、同じオペレータインタフェースを持つ別のロボットプラットフォーム上にゼロショットで転送することを実証する。
要約(オリジナル)
Teleoperated robotic characters can perform expressive interactions with humans, relying on the operators’ experience and social intuition. In this work, we propose to create autonomous interactive robots, by training a model to imitate operator data. Our model is trained on a dataset of human-robot interactions, where an expert operator is asked to vary the interactions and mood of the robot, while the operator commands as well as the pose of the human and robot are recorded. Our approach learns to predict continuous operator commands through a diffusion process and discrete commands through a classifier, all unified within a single transformer architecture. We evaluate the resulting model in simulation and with a user study on the real system. We show that our method enables simple autonomous human-robot interactions that are comparable to the expert-operator baseline, and that users can recognize the different robot moods as generated by our model. Finally, we demonstrate a zero-shot transfer of our model onto a different robotic platform with the same operator interface.
arxiv情報
| 著者 | Sammy Christen,David Müller,Agon Serifi,Ruben Grandia,Georg Wiedebach,Michael A. Hopkins,Espen Knoop,Moritz Bächer |
| 発行日 | 2025-04-03 16:06:44+00:00 |
| arxivサイト | arxiv_id(pdf) |