Sequential Dexterity: Chaining Dexterous Policies for Long-Horizon Manipulation

要約

現実世界の操作タスクの多くは、互いに大きく異なる一連のサブタスクで構成されています。
このような長期にわたる複雑な作業は、再握りや外部ツールを必要とせずに、異なる機能モード間をシームレスに移行できる適応性と多用途性を備えた器用な手の可能性を浮き彫りにします。
しかし、器用な手による高次元の行動空間と、長期にわたるタスクの複雑な構成力学により、課題が生じます。
私たちは、長期的なタスク目標を達成するために複数の器用なポリシーを連鎖させる強化学習 (RL) に基づく一般的なシステムである Sequential Dexterity を紹介します。
システムの中核となるのは、サブポリシーを段階的に微調整してチェーンの成功率を高めると同時に、障害からの回復や冗長ステージのバイパスのための自律的なポリシー切り替えを可能にする移行実現可能性機能です。
少数のタスク オブジェクトを使用したシミュレーションでのみトレーニングされているにもかかわらず、私たちのシステムは、新しいオブジェクト形状への一般化機能を実証し、器用な手を備えた現実世界のロボットにゼロショット転送することができます。
コードとビデオは https://sequential-dexterity.github.io で入手できます。

要約(オリジナル)

Many real-world manipulation tasks consist of a series of subtasks that are significantly different from one another. Such long-horizon, complex tasks highlight the potential of dexterous hands, which possess adaptability and versatility, capable of seamlessly transitioning between different modes of functionality without the need for re-grasping or external tools. However, the challenges arise due to the high-dimensional action space of dexterous hand and complex compositional dynamics of the long-horizon tasks. We present Sequential Dexterity, a general system based on reinforcement learning (RL) that chains multiple dexterous policies for achieving long-horizon task goals. The core of the system is a transition feasibility function that progressively finetunes the sub-policies for enhancing chaining success rate, while also enables autonomous policy-switching for recovery from failures and bypassing redundant stages. Despite being trained only in simulation with a few task objects, our system demonstrates generalization capability to novel object shapes and is able to zero-shot transfer to a real-world robot equipped with a dexterous hand. Code and videos are available at https://sequential-dexterity.github.io

arxiv情報

著者 Yuanpei Chen,Chen Wang,Li Fei-Fei,C. Karen Liu
発行日 2023-10-16 05:05:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク