要約
ロボット工学における模倣学習は、ロボット環境の複雑さとデータ収集のコストの高さにより、一般化において大きな課題に直面しています。
RoCoDA を紹介します。これは、不変性、等変性、因果関係の概念を 1 つのフレームワーク内で統合し、模倣学習のためのデータ拡張を強化する新しい手法です。
RoCoDA は、ポリシーの出力に影響を与えることなく、環境状態のタスクに無関係なサブセットを変更することにより、因果的不変性を利用します。
同時に、オブジェクトのポーズに剛体変換を適用し、対応するアクションを調整して合成デモンストレーションを生成することで、SE(3) 等分散性を利用します。
私たちは、5 つのロボット操作タスクに関する広範な実験を通じて RoCoDA を検証し、最先端のデータ拡張手法と比較してポリシーのパフォーマンス、一般化、サンプル効率の向上を実証しています。
私たちのポリシーは、目に見えないオブジェクトのポーズ、テクスチャ、および気を散らすものの存在に対する堅牢な一般化を示しています。
さらに、再把握などの新たな動作が観察され、RoCoDA でトレーニングされたポリシーがタスクのダイナミクスをより深く理解していることがわかります。
RoCoDA は、不変性、等変性、因果関係を活用することで、模倣学習におけるデータ拡張への原則に基づいたアプローチを提供し、幾何学的対称性と因果関係の推論の間のギャップを橋渡しします。
要約(オリジナル)
Imitation learning in robotics faces significant challenges in generalization due to the complexity of robotic environments and the high cost of data collection. We introduce RoCoDA, a novel method that unifies the concepts of invariance, equivariance, and causality within a single framework to enhance data augmentation for imitation learning. RoCoDA leverages causal invariance by modifying task-irrelevant subsets of the environment state without affecting the policy’s output. Simultaneously, we exploit SE(3) equivariance by applying rigid body transformations to object poses and adjusting corresponding actions to generate synthetic demonstrations. We validate RoCoDA through extensive experiments on five robotic manipulation tasks, demonstrating improvements in policy performance, generalization, and sample efficiency compared to state-of-the-art data augmentation methods. Our policies exhibit robust generalization to unseen object poses, textures, and the presence of distractors. Furthermore, we observe emergent behavior such as re-grasping, indicating policies trained with RoCoDA possess a deeper understanding of task dynamics. By leveraging invariance, equivariance, and causality, RoCoDA provides a principled approach to data augmentation in imitation learning, bridging the gap between geometric symmetries and causal reasoning.
arxiv情報
著者 | Ezra Ameperosa,Jeremy A. Collins,Mrinal Jain,Animesh Garg |
発行日 | 2024-11-25 21:57:15+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google