Learning Dual-Arm Push and Grasp Synergy in Dense Clutter

要約

衝突のない把握アフォーダンスが乏しいため、密集した環境でのロボットによる把握は困難です。
把握しにくい動作は、乱雑な環境でも実現可能な把握を増やす可能性がありますが、ほとんどの研究は双腕ではなく単腕の操作に焦点を当てています。
シングルアーム システムのポリシーでは、デュアルアーム調整の利点を十分に活用できません。
我々は、物体を掴むための双腕の押しと掴みの相乗効果を学習して、密集した乱雑な環境での器用な操作を強化する、ターゲット指向の階層型深層強化学習(DRL)フレームワークを提案します。
私たちのフレームワークは、事前にトレーニングされた深層学習バックボーンと、近接ポリシー最適化 (PPO) でトレーニングされた新しい CNN ベースの DRL モデルを介して、視覚的な観察をアクションにマッピングし、デュアルアーム プッシュ把握戦略を開発します。
バックボーンは、密集した環境での機能マッピングを強化します。
効率的な戦略学習を加速するために、新しいファジーベースの報酬関数が導入されています。
私たちのシステムは Isaac Gym で開発およびトレーニングされ、その後シミュレーションと実際のロボットでテストされています。
実験結果は、私たちのフレームワークが視覚データを二重の押しと掴みの動作に効果的にマッピングし、双腕システムが複雑な環境でターゲットオブジェクトを掴むことを可能にすることを示しています。
他の方法と比較して、私たちのアプローチは 6-DoF の把握候補を生成し、人間の行動を模倣した双腕のプッシュ動作を可能にします。
結果は、私たちの方法が密集した環境でタスクを効率的に完了できることを示しています。
https://sites.google.com/view/pg4da/home

要約(オリジナル)

Robotic grasping in densely cluttered environments is challenging due to scarce collision-free grasp affordances. Non-prehensile actions can increase feasible grasps in cluttered environments, but most research focuses on single-arm rather than dual-arm manipulation. Policies from single-arm systems fail to fully leverage the advantages of dual-arm coordination. We propose a target-oriented hierarchical deep reinforcement learning (DRL) framework that learns dual-arm push-grasp synergy for grasping objects to enhance dexterous manipulation in dense clutter. Our framework maps visual observations to actions via a pre-trained deep learning backbone and a novel CNN-based DRL model, trained with Proximal Policy Optimization (PPO), to develop a dual-arm push-grasp strategy. The backbone enhances feature mapping in densely cluttered environments. A novel fuzzy-based reward function is introduced to accelerate efficient strategy learning. Our system is developed and trained in Isaac Gym and then tested in simulations and on a real robot. Experimental results show that our framework effectively maps visual data to dual push-grasp motions, enabling the dual-arm system to grasp target objects in complex environments. Compared to other methods, our approach generates 6-DoF grasp candidates and enables dual-arm push actions, mimicking human behavior. Results show that our method efficiently completes tasks in densely cluttered environments. https://sites.google.com/view/pg4da/home

arxiv情報

著者 Yongliang Wang,Hamidreza Kasaei
発行日 2024-12-05 10:43:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク