要約
ロボット工学の模倣学習は、ロボット環境の複雑さとデータ収集のコストが高いため、一般化の重要な課題に直面しています。
Rocodaを紹介します。Rocodaは、単一のフレームワーク内で不変性、同等性、因果関係の概念を統合して、模倣学習のためのデータ増強を強化する新しい方法を統合します。
Rocodaは、ポリシーの出力に影響を与えることなく、環境状態のタスクに関係のあるサブセットを変更することにより、因果不変性を活用します。
同時に、剛体変換をオブジェクトのポーズに適用し、対応するアクションを調整して合成デモンストレーションを生成することにより、SE(3)等回を活用します。
5つのロボット操作タスクに関する広範な実験を通じてRocodaを検証し、最先端のデータ増強方法と比較して、ポリシーのパフォーマンス、一般化、およびサンプル効率の改善を実証します。
私たちのポリシーは、目に見えないオブジェクトのポーズ、テクスチャ、およびディストラクタの存在に堅牢な一般化を示します。
さらに、Regraspingなどの緊急行動が観察され、Rocodaで訓練されたポリシーがタスクのダイナミクスをより深く理解していることを示しています。
Rocodaは、不変性、同時性、因果関係を活用することにより、模倣学習におけるデータ増強に対する原則的なアプローチを提供し、幾何学的対称性と因果推論の間のギャップを埋めます。
プロジェクトページ:https://rocoda.github.io
要約(オリジナル)
Imitation learning in robotics faces significant challenges in generalization due to the complexity of robotic environments and the high cost of data collection. We introduce RoCoDA, a novel method that unifies the concepts of invariance, equivariance, and causality within a single framework to enhance data augmentation for imitation learning. RoCoDA leverages causal invariance by modifying task-irrelevant subsets of the environment state without affecting the policy’s output. Simultaneously, we exploit SE(3) equivariance by applying rigid body transformations to object poses and adjusting corresponding actions to generate synthetic demonstrations. We validate RoCoDA through extensive experiments on five robotic manipulation tasks, demonstrating improvements in policy performance, generalization, and sample efficiency compared to state-of-the-art data augmentation methods. Our policies exhibit robust generalization to unseen object poses, textures, and the presence of distractors. Furthermore, we observe emergent behavior such as re-grasping, indicating policies trained with RoCoDA possess a deeper understanding of task dynamics. By leveraging invariance, equivariance, and causality, RoCoDA provides a principled approach to data augmentation in imitation learning, bridging the gap between geometric symmetries and causal reasoning. Project Page: https://rocoda.github.io
arxiv情報
著者 | Ezra Ameperosa,Jeremy A. Collins,Mrinal Jain,Animesh Garg |
発行日 | 2025-05-20 01:17:09+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google