Working Backwards: Learning to Place by Picking


ピッキング経由の配置 (PvP) を紹介します。これは、接触が制限された特定の場所にオブジェクトを操作する必要がある配置タスクのファミリー向けに、現実世界のデモンストレーションを自律的に収集する方法です。
PvP では、掴むプロセスを逆にし、ピック アンド プレイスの問題に固有の対称性を利用することで、ロボットによるオブジェクト配置のデモンストレーションの収集に取り組みます。
当社のシステムは、把握のための準拠制御と触覚再把握という 2 つのモジュールを使用して、人間の介入なしで接触が制限された環境で何百ものデモンストレーションを収集できます。
そうすることで、ポリシーは特権情報なしでトレーニング環境外のオブジェクト配置シナリオ (テーブルから拾った皿を配置するなど) に一般化できます。


We present placing via picking (PvP), a method to autonomously collect real-world demonstrations for a family of placing tasks in which objects must be manipulated to specific, contact-constrained locations. With PvP, we approach the collection of robotic object placement demonstrations by reversing the grasping process and exploiting the inherent symmetry of the pick and place problems. Specifically, we obtain placing demonstrations from a set of grasp sequences of objects initially located at their target placement locations. Our system can collect hundreds of demonstrations in contact-constrained environments without human intervention using two modules: compliant control for grasping and tactile regrasping. We train a policy directly from visual observations through behavioural cloning, using the autonomously-collected demonstrations. By doing so, the policy can generalize to object placement scenarios outside of the training environment without privileged information (e.g., placing a plate picked up from a table). We validate our approach in home robot scenarios that include dishwasher loading and table setting. Our approach yields robotic placing policies that outperform policies trained with kinesthetic teaching, both in terms of success rate and data efficiency, while requiring no human supervision.


著者 Oliver Limoyo,Abhisek Konar,Trevor Ablett,Jonathan Kelly,Francois R. Hogan,Gregory Dudek
発行日 2024-12-26 03:44:08+00:00
カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク