Dexterous Pre-grasp Manipulation for Human-like Functional Categorical Grasping: Deep Reinforcement Learning and Grasp Representations

要約

ツールや家庭用品などの多くのオブジェクトは、非常に具体的な方法で把握した場合にのみ使用できます。
ただし、多くの場合、直接的な機能的把握は不可能です。
深い補強学習を使用して、人間のような機能的握りを達成するために、器用なグリスプグリップ操作ポリシーを学習する方法を提案します。
擬人化する手を持ついくつかの既知のオブジェクトカテゴリの新規インスタンスの巧妙な前把握操作が可能な単一のポリシーを学習できるようにする密なマルチコンポーネント報酬関数を導入します。
このポリシーは、専門家のデモンストレーションなしで、純粋にゼロからの補強学習によって純粋に学習されます。
暗黙的に、複雑な形状のオブジェクトを再配置して再配向して、特定の機能的握りを達成することを学びます。
さらに、目的の把握を表すための2つの異なる方法を探ります。明示的で抽象的な制約ベースです。
私たちの方法は、両方の把握表現を使用して、既知のカテゴリの以前に見えなかったオブジェクトインスタンスを操作し、希望する把握を成功裏に操作し、達成することを一貫して学習することを示します。
トレーニングは、3時間以内に単一のGPUで完了します。

要約(オリジナル)

Many objects, such as tools and household items, can be used only if grasped in a very specific way – grasped functionally. Often, a direct functional grasp is not possible, though. We propose a method for learning a dexterous pre-grasp manipulation policy to achieve human-like functional grasps using deep reinforcement learning. We introduce a dense multi-component reward function that enables learning a single policy, capable of dexterous pre-grasp manipulation of novel instances of several known object categories with an anthropomorphic hand. The policy is learned purely by means of reinforcement learning from scratch, without any expert demonstrations. It implicitly learns to reposition and reorient objects of complex shapes to achieve given functional grasps. In addition, we explore two different ways to represent a desired grasp: explicit and more abstract, constraint-based. We show that our method consistently learns to successfully manipulate and achieve desired grasps on previously unseen object instances of known categories using both grasp representations. Training is completed on a single GPU in under three hours.

arxiv情報

著者 Dmytro Pavlichenko,Sven Behnke
発行日 2025-02-26 14:34:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク