Hierarchical Diffusion Policy for Kinematics-Aware Multi-Task Robotic Manipulation


この論文では、マルチタスクのロボット操作のための階層エージェントである Hierarchical Diffusion Policy (HDP) を紹介します。
HDP は、操作ポリシーを階層構造に分解します。つまり、遠く離れた次善のエンドエフェクター ポーズ (NBP) を予測する高レベルのタスク計画エージェントと、最適な動作軌道を生成する低レベルの目標条件付き拡散ポリシーです。
因数分解されたポリシー表現により、HDP は、きめ細かい低レベルのアクションを生成しながら、長期的なタスク計画の両方に取り組むことができます。
ロボットの運動学の制約を満たしながらコンテキストを認識した運動軌道を生成するために、新しい運動学を認識した目標条件付き制御エージェントであるロボット運動学ディフューザー (RK-ディフューザー) を紹介します。
具体的には、RK-Diffuser は、エンドエフェクターのポーズと関節位置の軌道の両方を生成する方法を学習し、微分可能な運動学を介して、正確だが運動学を意識しないエンドエフェクターのポーズ ディフューザーを、運動学を意識するが精度の低い関節位置ディフューザーに抽出します。
我々は経験的に、HDP がシミュレーションと現実世界の両方で最先端の方法よりも大幅に高い成功率を達成することを示しています。


This paper introduces Hierarchical Diffusion Policy (HDP), a hierarchical agent for multi-task robotic manipulation. HDP factorises a manipulation policy into a hierarchical structure: a high-level task-planning agent which predicts a distant next-best end-effector pose (NBP), and a low-level goal-conditioned diffusion policy which generates optimal motion trajectories. The factorised policy representation allows HDP to tackle both long-horizon task planning while generating fine-grained low-level actions. To generate context-aware motion trajectories while satisfying robot kinematics constraints, we present a novel kinematics-aware goal-conditioned control agent, Robot Kinematics Diffuser (RK-Diffuser). Specifically, RK-Diffuser learns to generate both the end-effector pose and joint position trajectories, and distill the accurate but kinematics-unaware end-effector pose diffuser to the kinematics-aware but less accurate joint position diffuser via differentiable kinematics. Empirically, we show that HDP achieves a significantly higher success rate than the state-of-the-art methods in both simulation and real-world.


著者 Xiao Ma,Sumit Patidar,Iain Haughton,Stephen James
発行日 2024-03-06 17:50:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO パーマリンク