Zero-Shot Transfer of Haptics-Based Object Insertion Policies

要約

人間は、食器洗い機に荷物を入れたり、本棚に品物を入れたりするなど、接触が多い作業中に自然に触覚フィードバックを利用します。
現在のロボット システムは、予期せぬ接触を回避することに焦点を当てており、多くの場合、戦略的に配置された環境センサーに依存しています。
最近では、接触を利用した操作ポリシーがシミュレーションでトレーニングされ、実際のロボットに導入されています。
ただし、シミュレーションと現実のギャップを埋めるには、何らかの形で現実世界に適応する必要がありますが、これはすべてのシナリオで実現可能であるとは限りません。
この論文では、プレートをスロット付きホルダーにロードするという接触の多い家事のために、シミュレーションで接触を利用した操作ポリシーをトレーニングします。これは、実際のロボットに微調整することなく転送されます。
私たちは、時間遅延モデリング、メモリ表現、ドメインのランダム化など、このゼロショット転送に必要なさまざまな要素を調査します。
当社のポリシーは、シミュレーションと実際のギャップを最小限に抑えて移行し、ヒューリスティックベースラインや学習ベースラインを大幅に上回ります。
また、さまざまなサイズと重量のプレートにも一般化されます。
デモのビデオとコードは、https://sites.google.com/view/compliance-object-insertion で入手できます。

要約(オリジナル)

Humans naturally exploit haptic feedback during contact-rich tasks like loading a dishwasher or stocking a bookshelf. Current robotic systems focus on avoiding unexpected contact, often relying on strategically placed environment sensors. Recently, contact-exploiting manipulation policies have been trained in simulation and deployed on real robots. However, they require some form of real-world adaptation to bridge the sim-to-real gap, which might not be feasible in all scenarios. In this paper we train a contact-exploiting manipulation policy in simulation for the contact-rich household task of loading plates into a slotted holder, which transfers without any fine-tuning to the real robot. We investigate various factors necessary for this zero-shot transfer, like time delay modeling, memory representation, and domain randomization. Our policy transfers with minimal sim-to-real gap and significantly outperforms heuristic and learnt baselines. It also generalizes to plates of different sizes and weights. Demonstration videos and code are available at https://sites.google.com/view/compliant-object-insertion.

arxiv情報

著者 Samarth Brahmbhatt,Ankur Deka,Andrew Spielberg,Matthias Müller
発行日 2023-06-08 01:16:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク