EquiBot: SIM(3)-Equivariant Diffusion Policy for Generalizable and Data Efficient Learning

要約

ロボットが限られたデータから学習しながら、現実世界の多様な環境に汎用化できる効果的な模倣学習手法を構築することは、ロボット学習における長年の課題です。
私たちは、ロボット操作タスク学習のための堅牢でデータ効率が高く、一般化可能なアプローチである Equibot を提案します。
私たちのアプローチは、SIM(3) 等価ニューラル ネットワーク アーキテクチャと拡散モデルを組み合わせたものです。
これにより、学習されたポリシーがスケール、回転、変換の変化に対して不変であることが保証され、マルチモダリティや堅牢性などの拡散ベースのポリシー学習の利点を維持しながら、目に見えない環境への適用性が向上します。
6 つのシミュレーション タスクのスイートで、提案した方法によりデータ要件が軽減され、新しいシナリオへの一般化が向上することを示します。
実際の世界では、6 つのモバイル操作タスクの 10 のバリエーションを使用して、各タスクで人間によるわずか 5 分間のデモンストレーションから学習した後、私たちの方法が新しいオブジェクトやシーンに簡単に一般化できることを示します。

要約(オリジナル)

Building effective imitation learning methods that enable robots to learn from limited data and still generalize across diverse real-world environments is a long-standing problem in robot learning. We propose Equibot, a robust, data-efficient, and generalizable approach for robot manipulation task learning. Our approach combines SIM(3)-equivariant neural network architectures with diffusion models. This ensures that our learned policies are invariant to changes in scale, rotation, and translation, enhancing their applicability to unseen environments while retaining the benefits of diffusion-based policy learning such as multi-modality and robustness. We show on a suite of 6 simulation tasks that our proposed method reduces the data requirements and improves generalization to novel scenarios. In the real world, with 10 variations of 6 mobile manipulation tasks, we show that our method can easily generalize to novel objects and scenes after learning from just 5 minutes of human demonstrations in each task.

arxiv情報

著者 Jingyun Yang,Zi-ang Cao,Congyue Deng,Rika Antonova,Shuran Song,Jeannette Bohg
発行日 2024-10-29 17:49:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク