Working Backwards: Learning to Place by Picking

要約

我々は、オブジェクトを特定の位置に操作する必要がある一連の配置タスクのデモンストレーションを自律的に収集できる方法である、ピッキングによる配置学習 (LPP) を紹介します。
LPP では、把握プロセスを逆にし、ピック アンド プレイスの問題に固有の対称性を利用することで、ロボットによるオブジェクト配置ポリシーの学習にアプローチします。
具体的には、最初にターゲット配置位置に配置されたオブジェクトの一連の把握シーケンスから配置デモンストレーションを取得します。
当社のシステムは、触覚センシングと把握のための準拠した制御を組み合わせて使用​​することにより、人間の介入なしで何百ものデモンストレーションを収集することができます。
自律的に収集されたデモンストレーションを使用して、動作の複製を通じて視覚的観察から直接ポリシーをトレーニングします。
そうすることで、ポリシーは特権情報なしでトレーニング環境外のオブジェクト配置シナリオに一般化できます (例: テーブルから拾ったプレートを元の配置場所に配置しない)。
食器洗い機への投入やテーブルセッティングを含む家庭用ロボットのシナリオに対するアプローチを検証します。
私たちのアプローチは、人間の監督を必要とせずに、パフォーマンスとデータ効率の両方の点で、運動感覚教育で訓練されたポリシーを上回るロボット配置ポリシーを生み出します。

要約(オリジナル)

We present Learning to Place by Picking (LPP), a method capable of autonomously collecting demonstrations for a family of placing tasks in which objects must be manipulated to specific locations. With LPP, we approach the learning of robotic object placement policies by reversing the grasping process and exploiting the inherent symmetry of the pick and place problems. Specifically, we obtain placing demonstrations from a set of grasp sequences of objects that are initially located at their target placement locations. Our system is capable of collecting hundreds of demonstrations without human intervention by using a combination of tactile sensing and compliant control for grasps. We train a policy directly from visual observations through behaviour cloning, using the autonomously-collected demonstrations. By doing so, the policy can generalize to object placement scenarios outside of the training environment without privileged information (e.g., placing a plate picked up from a table and not at the original placement location). We validate our approach on home robotic scenarios that include dishwasher loading and table setting. Our approach yields robotic placing policies that outperform policies trained with kinesthetic teaching, both in terms of performance and data efficiency, while requiring no human supervision.

arxiv情報

著者 Oliver Limoyo,Abhisek Konar,Trevor Ablett,Jonathan Kelly,Francois R. Hogan,Gregory Dudek
発行日 2023-12-04 21:32:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク