要約
ボックスピックアップやローリング生地など、人間が実行する多くのコンタクトリッチタスクは、信頼できる実行のために力のフィードバックに依存しています。
ただし、ほとんどのロボットアームで容易に入手できるこの力情報は、テレオ操作と政策学習では一般的には使用されていません。
その結果、ロボットの動作は、複雑なフォースフィードバックを必要としない準静的運動学的タスクに限定されることがよくあります。
このホワイトペーパーでは、最初に、フォロワーアームの外力を教師アームに戻す低コストで直感的な二国間術セットアップを提示し、複雑で接触豊富なタスクのデータ収集を促進します。
次に、Training全体で強度が低下して視覚入力を破壊するカリキュラムを使用する政策学習方法であるFactrを紹介します。
カリキュラムは、変圧器ベースのポリシーが視覚入力に過度に適合するのを防ぎ、フォースモダリティに適切に注意するためのポリシーを導きます。
フォース情報を完全に活用することにより、この方法は、カリキュラムなしのベースラインアプローチと比較して、目に見えないオブジェクトへの一般化を43%増加させることを実証します。
https://jasonjzliu.com/factr/でのビデオの結果と手順
要約(オリジナル)
Many contact-rich tasks humans perform, such as box pickup or rolling dough, rely on force feedback for reliable execution. However, this force information, which is readily available in most robot arms, is not commonly used in teleoperation and policy learning. Consequently, robot behavior is often limited to quasi-static kinematic tasks that do not require intricate force-feedback. In this paper, we first present a low-cost, intuitive, bilateral teleoperation setup that relays external forces of the follower arm back to the teacher arm, facilitating data collection for complex, contact-rich tasks. We then introduce FACTR, a policy learning method that employs a curriculum which corrupts the visual input with decreasing intensity throughout training. The curriculum prevents our transformer-based policy from over-fitting to the visual input and guides the policy to properly attend to the force modality. We demonstrate that by fully utilizing the force information, our method significantly improves generalization to unseen objects by 43\% compared to baseline approaches without a curriculum. Video results and instructions at https://jasonjzliu.com/factr/
arxiv情報
著者 | Jason Jingzhou Liu,Yulong Li,Kenneth Shaw,Tony Tao,Ruslan Salakhutdinov,Deepak Pathak |
発行日 | 2025-02-24 18:59:07+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google