要約
複雑な物理環境で長期的なロボット ポリシーをトレーニングすることは、ロボット操作などの多くのアプリケーションにとって不可欠です。
ただし、目に見えないタスクに一般化できるポリシーを学習するのは困難です。
この研究では、計画の生成と計画の実行を分離することで、ワンショット タスクの一般化を実現することを提案します。
具体的には、私たちの方法は、複雑な長期タスクを 3 つのステップで解決します。幾何学と物理学を単純化してペアの抽象環境を構築し、抽象軌道を生成し、抽象から実行可能軌道へのトランスレーターによって元のタスクを解決します。
抽象環境では、物理操作などの複雑なダイナミクスが削除され、抽象的な軌道の生成が容易になります。
ただし、抽象的な軌跡には低レベルの詳細が欠如しており、実行された軌跡とフレームごとに位置合わせされていないため、これにより、抽象的な軌跡と実際に実行された軌跡の間に大きな領域ギャップが生じます。
言語翻訳を彷彿とさせる方法で、私たちのアプローチは seq-to-seq モデルを活用して、抽象的な軌道と実行可能な軌道の間の大きなドメインのギャップを克服し、低レベルのポリシーが抽象的な軌道に従うことを可能にします。
さまざまなロボットの実施形態による、さまざまな目に見えない長期的なタスクに関する実験結果は、ワンショットタスクの一般化を達成するための私たちの方法の実用性を実証しています。
要約(オリジナル)
Training long-horizon robotic policies in complex physical environments is essential for many applications, such as robotic manipulation. However, learning a policy that can generalize to unseen tasks is challenging. In this work, we propose to achieve one-shot task generalization by decoupling plan generation and plan execution. Specifically, our method solves complex long-horizon tasks in three steps: build a paired abstract environment by simplifying geometry and physics, generate abstract trajectories, and solve the original task by an abstract-to-executable trajectory translator. In the abstract environment, complex dynamics such as physical manipulation are removed, making abstract trajectories easier to generate. However, this introduces a large domain gap between abstract trajectories and the actual executed trajectories as abstract trajectories lack low-level details and are not aligned frame-to-frame with the executed trajectory. In a manner reminiscent of language translation, our approach leverages a seq-to-seq model to overcome the large domain gap between the abstract and executable trajectories, enabling the low-level policy to follow the abstract trajectory. Experimental results on various unseen long-horizon tasks with different robot embodiments demonstrate the practicability of our methods to achieve one-shot task generalization.
arxiv情報
| 著者 | Stone Tao,Xiaochen Li,Tongzhou Mu,Zhiao Huang,Yuzhe Qin,Hao Su | 
| 発行日 | 2023-05-30 23:44:17+00:00 | 
| arxivサイト | arxiv_id(pdf) | 
提供元, 利用サービス
arxiv.jp, Google
