Learning Dual-Arm Push and Grasp Synergy in Dense Clutter

要約

密集した環境でのロボットの握りは、衝突のないアフォーダンスが不足しているため、困難です。
非充実したアクションは、散らかった環境で実行可能な把握を増加させる可能性がありますが、ほとんどの研究では、二重腕の操作ではなく、単一の腕に焦点を当てています。
単腕システムからのポリシーは、デュアルアーム調整の利点を完全に活用できません。
私たちは、密集した乱雑さで器用な操作を強化するためにオブジェクトを把握するための二重の腕のプッシュグラスの相乗効果を学ぶターゲット指向の階層深補強学習(DRL)フレームワークを提案します。
当社のフレームワークは、デュアルアームプッシュグラスプラス戦略を開発するために、近位政策最適化(PPO)で訓練された、事前に訓練されたディープラーニングバックボーンと新しいCNNベースのDRLモデルを介したアクションを視覚的な観察結果にマッピングします。
バックボーンは、密集した環境での機能マッピングを強化します。
効率的な戦略学習を加速するために、新しいファジーベースの報酬関数が導入されています。
当社のシステムは、Isaacジムで開発および訓練され、シミュレーションおよび実際のロボットでテストされています。
実験結果は、フレームワークが視覚データをデュアルプッシュグラスの動きに効果的にマッピングし、デュアルアームシステムが複雑な環境でターゲットオブジェクトを把握できるようにすることを示しています。
他の方法と比較して、私たちのアプローチは6-DOFの把握候補を生成し、デュアルアームプッシュアクションを可能にし、人間の行動を模倣します。
結果は、この方法が密集した環境でタスクを効率的に完了することを示しています。
https://sites.google.com/view/pg4da/home

要約(オリジナル)

Robotic grasping in densely cluttered environments is challenging due to scarce collision-free grasp affordances. Non-prehensile actions can increase feasible grasps in cluttered environments, but most research focuses on single-arm rather than dual-arm manipulation. Policies from single-arm systems fail to fully leverage the advantages of dual-arm coordination. We propose a target-oriented hierarchical deep reinforcement learning (DRL) framework that learns dual-arm push-grasp synergy for grasping objects to enhance dexterous manipulation in dense clutter. Our framework maps visual observations to actions via a pre-trained deep learning backbone and a novel CNN-based DRL model, trained with Proximal Policy Optimization (PPO), to develop a dual-arm push-grasp strategy. The backbone enhances feature mapping in densely cluttered environments. A novel fuzzy-based reward function is introduced to accelerate efficient strategy learning. Our system is developed and trained in Isaac Gym and then tested in simulations and on a real robot. Experimental results show that our framework effectively maps visual data to dual push-grasp motions, enabling the dual-arm system to grasp target objects in complex environments. Compared to other methods, our approach generates 6-DoF grasp candidates and enables dual-arm push actions, mimicking human behavior. Results show that our method efficiently completes tasks in densely cluttered environments. https://sites.google.com/view/pg4da/home

arxiv情報

著者 Yongliang Wang,Hamidreza Kasaei
発行日 2025-04-02 10:45:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク