要約
人間は手以外の腕の一部を集めたりサポートしたりする操作に使用できますが、ロボットが同じ種類の操作を効果的に学習して実行できるかどうかは、比較的未解明なままです。
これらの操作にはロボットの完全な姿勢を制御する関節レベルの制御が必要であるため、遠隔操作やデモンストレーション収集用に、低コストで適応性があり、持ち運び可能な双腕外骨格である AirExo を開発しました。
遠隔操作データの収集には費用と時間がかかるため、AirExo をさらに活用して、安価な実地デモを大規模に収集します。
当社の野外学習フレームワークの下では、わずか 3 分間の遠隔操作デモンストレーションと、AirExo によって収集された多様かつ広範な野外データによって強化されたロボットが、同等かそれ以上のポリシーを学習できることを示しています。
ある人は 20 分以上続く遠隔操作のデモンストレーションから学びました。
実験では、私たちのアプローチにより、モデルがタスクのさまざまな段階にわたってより一般的で堅牢なポリシーを学習できるようになり、外乱が存在する場合でもタスク完了の成功率が向上することが実証されました。
プロジェクト Web サイト: https://airexo.github.io/
要約(オリジナル)
While humans can use parts of their arms other than the hands for manipulations like gathering and supporting, whether robots can effectively learn and perform the same type of operations remains relatively unexplored. As these manipulations require joint-level control to regulate the complete poses of the robots, we develop AirExo, a low-cost, adaptable, and portable dual-arm exoskeleton, for teleoperation and demonstration collection. As collecting teleoperated data is expensive and time-consuming, we further leverage AirExo to collect cheap in-the-wild demonstrations at scale. Under our in-the-wild learning framework, we show that with only 3 minutes of the teleoperated demonstrations, augmented by diverse and extensive in-the-wild data collected by AirExo, robots can learn a policy that is comparable to or even better than one learned from teleoperated demonstrations lasting over 20 minutes. Experiments demonstrate that our approach enables the model to learn a more general and robust policy across the various stages of the task, enhancing the success rates in task completion even with the presence of disturbances. Project website: https://airexo.github.io/
arxiv情報
著者 | Hongjie Fang,Hao-Shu Fang,Yiming Wang,Jieji Ren,Jingjing Chen,Ruo Zhang,Weiming Wang,Cewu Lu |
発行日 | 2023-09-26 14:48:29+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google