要約
拡散政策などの模倣学習は、様々なロボット操作タスクにおいて有効であることが証明されている。しかし、ポリシーの頑健性と汎化のためには、広範なデモンストレーションが必要である。実証実験への依存を減らすために、我々は空間対称性を活用し、複雑なロボット操作タスクにおける行動シーケンスを生成するための効率的な軌道レベルSE(3)等変量拡散モデルであるET-SEEDを提案する。さらに、従来の等変量拡散モデルでは、マルコフ過程におけるステップ毎の等変量性が必要であり、このような強い制約のもとではポリシーの学習が困難である。我々は理論的に等変量マルコフカーネルを拡張し、等変量拡散過程の条件を単純化することで、軌跡レベルのSE(3)等変量拡散政策の学習効率をエンドツーエンドで大幅に改善する。ET-SEEDを、剛体、多関節、変形可能な物体を含む代表的なロボット操作タスクで評価する。実験により、本提案手法の優れたデータ効率と操作習熟度が実証され、また、わずか数回のデモで未知の構成に汎化する能力が実証された。ウェブサイト:https://et-seed.github.io/
要約(オリジナル)
Imitation learning, e.g., diffusion policy, has been proven effective in various robotic manipulation tasks. However, extensive demonstrations are required for policy robustness and generalization. To reduce the demonstration reliance, we leverage spatial symmetry and propose ET-SEED, an efficient trajectory-level SE(3) equivariant diffusion model for generating action sequences in complex robot manipulation tasks. Further, previous equivariant diffusion models require the per-step equivariance in the Markov process, making it difficult to learn policy under such strong constraints. We theoretically extend equivariant Markov kernels and simplify the condition of equivariant diffusion process, thereby significantly improving training efficiency for trajectory-level SE(3) equivariant diffusion policy in an end-to-end manner. We evaluate ET-SEED on representative robotic manipulation tasks, involving rigid body, articulated and deformable object. Experiments demonstrate superior data efficiency and manipulation proficiency of our proposed method, as well as its ability to generalize to unseen configurations with only a few demonstrations. Website: https://et-seed.github.io/
arxiv情報
著者 | Chenrui Tie,Yue Chen,Ruihai Wu,Boxuan Dong,Zeyi Li,Chongkai Gao,Hao Dong |
発行日 | 2025-03-02 08:11:34+00:00 |
arxivサイト | arxiv_id(pdf) |