Learning Reusable Manipulation Strategies

要約

人間は、操作の「トリック」を習得し、一般化する素晴らしい能力を示す。例えば、スープ柄杓を使って遠くの物体に手を伸ばすというような一つのデモンストレーションからでさえ、私たちはこのスキルを、物体の位置、大きさ、カテゴリー(フォークやハンマーなど)が異なる新たなシナリオに応用することができる。さらに、様々なスキルを柔軟に組み合わせることで、長期的な計画を立てることができる。本論文では、「メカニズム」と呼ばれるこのような操作スキルを、1回のデモンストレーションとセルフプレイを通じて機械が習得することを可能にするフレームワークを紹介する。我々の重要な洞察は、各実演をロボット-物体および物体-物体の接触モードの変化のシーケンスとして解釈することにあり、これは連続パラメータに対する詳細なサンプラーを学習するための足場を提供する。これらの学習された機構とサンプラーは、標準的なタスクプランナーとモーションプランナーにシームレスに統合することができ、構成的な利用を可能にする。

要約(オリジナル)

Humans demonstrate an impressive ability to acquire and generalize manipulation ‘tricks.’ Even from a single demonstration, such as using soup ladles to reach for distant objects, we can apply this skill to new scenarios involving different object positions, sizes, and categories (e.g., forks and hammers). Additionally, we can flexibly combine various skills to devise long-term plans. In this paper, we present a framework that enables machines to acquire such manipulation skills, referred to as ‘mechanisms,’ through a single demonstration and self-play. Our key insight lies in interpreting each demonstration as a sequence of changes in robot-object and object-object contact modes, which provides a scaffold for learning detailed samplers for continuous parameters. These learned mechanisms and samplers can be seamlessly integrated into standard task and motion planners, enabling their compositional use.

arxiv情報

著者 Jiayuan Mao,Joshua B. Tenenbaum,Tomás Lozano-Pérez,Leslie Pack Kaelbling
発行日 2023-11-06 17:35:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク