Multimodal Reinforcement Learning for Robots Collaborating with Humans

要約

高齢者や障害のある人のためのロボット アシスタントは、共同作業でユーザーと対話する必要があります。
これらのシステムのコア コンポーネントはインタラクション マネージャーです。その仕事は、タスクを観察して評価し、人間の状態とロボットの最善の行動方針を選択する意図を推測することです。
このドメインのデータはまばらであるため、このようなマルチモーダル システムのポリシーは手作業で作成されることがよくあります。
インタラクションの複雑さが増すにつれて、このプロセスはスケーラブルではなくなります。
この論文では、ロボットのポリシーを学習するための強化学習 (RL) アプローチを提案します。
対話システムとは対照的に、エージェントは人間のデータを使用して開発されたシミュレーターでトレーニングされ、言語や身体動作などの複数のモダリティを処理できます。
ユーザーとの対話におけるシステムのパフォーマンスを評価するために、人間の研究を実施しました。
私たちが設計したシステムは、実際のユーザーが使用したときに有望な予備結果を示しています。

要約(オリジナル)

Robot assistants for older adults and people with disabilities need to interact with their users in collaborative tasks. The core component of these systems is an interaction manager whose job is to observe and assess the task, and infer the state of the human and their intent to choose the best course of action for the robot. Due to the sparseness of the data in this domain, the policy for such multi-modal systems is often crafted by hand; as the complexity of interactions grows this process is not scalable. In this paper, we propose a reinforcement learning (RL) approach to learn the robot policy. In contrast to the dialog systems, our agent is trained with a simulator developed by using human data and can deal with multiple modalities such as language and physical actions. We conducted a human study to evaluate the performance of the system in the interaction with a user. Our designed system shows promising preliminary results when it is used by a real user.

arxiv情報

著者 Afagh Mehri Shervedani,Siyu Li,Natawut Monaikul,Bahareh Abbasi,Barbara Di Eugenio,Milos Zefran
発行日 2023-03-13 16:44:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク