要約
インテリジェントロボットにとっては、習得したスキルを伝達して、同様ではあるが新しいタスクの範囲を達成する能力が不可欠です。
この研究では、微分可能な物理シミュレーションを利用してロボットのスキルを効率的に伝達する新しいフレームワークである $\textit{Diff-Transfer}$ を紹介します。
具体的には、$\textit{Diff-Transfer}$ は、ソース タスクをターゲット タスクに運ぶタスク空間内の実行可能なパスを発見します。
このタスク パス (2 つのサブタスク) に沿った隣接するポイントの各ペアで、$\textit{Diff-Transfer}$ は、一方のサブタスクからの既知のアクションを適応させて、もう一方のサブタスクにうまく取り組みます。
適応は、微分可能な物理シミュレーションからの勾配情報によって導かれます。
タスクレベルの状態と報酬による $Q$ 学習を活用して、サブタスクを生成する新しいパス計画方法を提案します。
私たちはフレームワークをシミュレーション実験に実装し、ロボット操作に関する 4 つの困難な転送タスクを実行し、包括的な実験を通じて $\textit{Diff-Transfer}$ の有効性を実証します。
補足とビデオはウェブサイト https://sites.google.com/view/difftransfer にあります。
要約(オリジナル)
The capability to transfer mastered skills to accomplish a range of similar yet novel tasks is crucial for intelligent robots. In this work, we introduce $\textit{Diff-Transfer}$, a novel framework leveraging differentiable physics simulation to efficiently transfer robotic skills. Specifically, $\textit{Diff-Transfer}$ discovers a feasible path within the task space that brings the source task to the target task. At each pair of adjacent points along this task path, which is two sub-tasks, $\textit{Diff-Transfer}$ adapts known actions from one sub-task to tackle the other sub-task successfully. The adaptation is guided by the gradient information from differentiable physics simulations. We propose a novel path-planning method to generate sub-tasks, leveraging $Q$-learning with a task-level state and reward. We implement our framework in simulation experiments and execute four challenging transfer tasks on robotic manipulation, demonstrating the efficacy of $\textit{Diff-Transfer}$ through comprehensive experiments. Supplementary and Videos are on the website https://sites.google.com/view/difftransfer
arxiv情報
著者 | Yuqi Xiang,Feitong Chen,Qinsi Wang,Yang Gang,Xiang Zhang,Xinghao Zhu,Xingyu Liu,Lin Shao |
発行日 | 2023-10-10 01:36:56+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google