Composing Dextrous Grasping and In-hand Manipulation via Scoring with a Reinforcement Learning Critic

要約

手の操作と把握は基本的ですが、多くの場合、ロボット工学のタスクに個別に対処されています。
手元の操作ポリシーを導き出すために、補強学習は最近大きな成功を示しています。
ただし、派生したコントローラーは、実世界のシナリオではまだ有用ではありません。これは、適切な初期(グラズピン)状態にオブジェクトを配置するためにヒトオペレーターが必要なことが多いためです。
望ましい手元の操作目標を促進する安定した握りを見つけることは、オープンな問題です。
この作業では、最初の握りを選択して選択するために訓練された強化学習エージェントの批評家ネットワークを活用することにより、このギャップを埋める方法を提案します。
私たちの実験は、この方法が追加のトレーニングを必要とせずに、手の操作の成功率を大幅に上げることを示しています。
また、現実世界のシステムで完全な操作操作パイプラインの実装を提示し、扱いにくいオブジェクトでさえ自律的な把握と方向転換を可能にします。

要約(オリジナル)

In-hand manipulation and grasping are fundamental yet often separately addressed tasks in robotics. For deriving in-hand manipulation policies, reinforcement learning has recently shown great success. However, the derived controllers are not yet useful in real-world scenarios because they often require a human operator to place the objects in suitable initial (grasping) states. Finding stable grasps that also promote the desired in-hand manipulation goal is an open problem. In this work, we propose a method for bridging this gap by leveraging the critic network of a reinforcement learning agent trained for in-hand manipulation to score and select initial grasps. Our experiments show that this method significantly increases the success rate of in-hand manipulation without requiring additional training. We also present an implementation of a full grasp manipulation pipeline on a real-world system, enabling autonomous grasping and reorientation even of unwieldy objects.

arxiv情報

著者 Lennart Röstel,Dominik Winkelbauer,Johannes Pitz,Leon Sievers,Berthold Bäuml
発行日 2025-05-19 15:36:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク