Diffusion Co-Policy for Synergistic Human-Robot Collaborative Tasks

要約

多様な人間の行動を正確にモデル化することは、特に共同作業において、人間とロボットの間のインタラクションのレベルを向上させる上で重要な障壁となっていました。
私たちの重要な洞察は、物理的なタスクにおける人間の行動の予測精度が、人間の行動予測を含む方法のモデルによってボトルネックになっているということです。
人間と人間の協力的なデモンストレーションのデータセットでノイズ除去拡散確率モデルをトレーニングし、過去の人間のパートナーの行動を条件付けして、テスト中に人間とうまく相乗するロボットの一連の行動を計画する方法を紹介します。
我々は、この方法が、シミュレーションと人間がループに入った実際の設定の両方において、人間とロボットのテーブル運び、つまり連続的な状態動作タスクにおいて、他の最先端の学習方法よりも優れていることを実証します。
さらに、相互適応、共有タスクの理解、リーダーシップの切り替え、学習したパートナーの行動、反対意見から生じる低レベルの無駄な相互作用力など、真の人間とロボットのコラボレーションの証拠を示す、評価中に生じる説得力のあるロボットの行動を定性的に強調します。
プロジェクトページは近日公開予定です。

要約(オリジナル)

Modeling multimodal human behavior accurately has been a key barrier to increasing the level of interaction between human and robot, particularly for collaborative tasks. Our key insight is that the predictive accuracy of human behaviors on physical tasks is bottlenecked by the model for methods involving human behavior prediction. We present a method for training denoising diffusion probabilistic models on a dataset of collaborative human-human demonstrations and conditioning on past human partner actions to plan sequences of robot actions that synergize well with humans during test time. We demonstrate the method outperforms other state-of-art learning methods on human-robot table-carrying, a continuous state-action task, in both simulation and real settings with a human in the loop. Moreover, we qualitatively highlight compelling robot behaviors that arise during evaluations that demonstrate evidence of true human-robot collaboration, including mutual adaptation, shared task understanding, leadership switching, learned partner behaviors, and low levels of wasteful interaction forces arising from dissent. Project page coming soon.

arxiv情報

著者 Eley Ng,Ziang Liu,Monroe Kennedy III
発行日 2023-05-20 11:21:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク