要約
拡散政策などの模倣学習は、さまざまなロボット操作タスクで効果的であることが証明されています。
ただし、政策の堅牢性と一般化には広範な実証が必要です。
実証への依存を減らすために、我々は空間対称性を活用し、複雑なロボット操作タスクにおけるアクションシーケンスを生成するための効率的な軌道レベルのSE(3)等変拡散モデルであるET-SEEDを提案する。
さらに、以前の等変拡散モデルではマルコフ過程におけるステップごとの等分散が必要であり、そのような強い制約の下でポリシーを学習することが困難でした。
等変マルコフカーネルを理論的に拡張し、等変拡散プロセスの条件を簡素化することで、軌道レベルのSE(3)等変拡散ポリシーの学習効率をエンドツーエンドで大幅に向上させます。
剛体、多関節、変形可能な物体を含む代表的なロボット操作タスクで ET-SEED を評価します。
実験では、私たちが提案した方法の優れたデータ効率と操作能力に加え、わずか数回のデモンストレーションで目に見えない構成に一般化できるその能力を実証しています。
ウェブサイト: https://et-seed.github.io/
要約(オリジナル)
Imitation learning, e.g., diffusion policy, has been proven effective in various robotic manipulation tasks. However, extensive demonstrations are required for policy robustness and generalization. To reduce the demonstration reliance, we leverage spatial symmetry and propose ET-SEED, an efficient trajectory-level SE(3) equivariant diffusion model for generating action sequences in complex robot manipulation tasks. Further, previous equivariant diffusion models require the per-step equivariance in the Markov process, making it difficult to learn policy under such strong constraints. We theoretically extend equivariant Markov kernels and simplify the condition of equivariant diffusion process, thereby significantly improving training efficiency for trajectory-level SE(3) equivariant diffusion policy in an end-to-end manner. We evaluate ET-SEED on representative robotic manipulation tasks, involving rigid body, articulated and deformable object. Experiments demonstrate superior data efficiency and manipulation proficiency of our proposed method, as well as its ability to generalize to unseen configurations with only a few demonstrations. Website: https://et-seed.github.io/
arxiv情報
著者 | Chenrui Tie,Yue Chen,Ruihai Wu,Boxuan Dong,Zeyi Li,Chongkai Gao,Hao Dong |
発行日 | 2024-11-06 15:30:42+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google