Working Backwards: Learning to Place by Picking

要約

ピッキング経由の配置 (PvP) を紹介します。これは、接触が制限された特定の場所にオブジェクトを操作する必要がある配置タスクのファミリー向けに、現実世界のデモンストレーションを自律的に収集する方法です。
PvP では、掴むプロセスを逆にし、ピック アンド プレイスの問題に固有の対称性を利用することで、ロボットによるオブジェクト配置のデモンストレーションの収集に取り組みます。
具体的には、最初にターゲット配置位置に配置されたオブジェクトの一連の把握シーケンスから配置デモンストレーションを取得します。
当社のシステムは、把握のための準拠制御と触覚再把握という 2 つのモジュールを使用して、人間の介入なしで接触が制限された環境で何百ものデモンストレーションを収集できます。
自律的に収集されたデモンストレーションを使用して、視覚的観察から行動のクローン作成を通じてポリシーを直接トレーニングします。
そうすることで、ポリシーは特権情報なしでトレーニング環境外のオブジェクト配置シナリオ (テーブルから拾った皿を配置するなど) に一般化できます。
食器洗い機の投入やテーブルセッティングを含む家庭用ロボットのシナリオでアプローチを検証します。
私たちのアプローチは、人間の監督を必要とせずに、成功率とデータ効率の両方の点で、運動感覚教育で訓練されたポリシーよりも優れたロボット配置ポリシーを生み出します。

要約(オリジナル)

We present placing via picking (PvP), a method to autonomously collect real-world demonstrations for a family of placing tasks in which objects must be manipulated to specific, contact-constrained locations. With PvP, we approach the collection of robotic object placement demonstrations by reversing the grasping process and exploiting the inherent symmetry of the pick and place problems. Specifically, we obtain placing demonstrations from a set of grasp sequences of objects initially located at their target placement locations. Our system can collect hundreds of demonstrations in contact-constrained environments without human intervention using two modules: compliant control for grasping and tactile regrasping. We train a policy directly from visual observations through behavioural cloning, using the autonomously-collected demonstrations. By doing so, the policy can generalize to object placement scenarios outside of the training environment without privileged information (e.g., placing a plate picked up from a table). We validate our approach in home robot scenarios that include dishwasher loading and table setting. Our approach yields robotic placing policies that outperform policies trained with kinesthetic teaching, both in terms of success rate and data efficiency, while requiring no human supervision.

arxiv情報

著者 Oliver Limoyo,Abhisek Konar,Trevor Ablett,Jonathan Kelly,Francois R. Hogan,Gregory Dudek
発行日 2024-07-09 15:21:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク