要約
学習ベースの把握は、その高い計算効率のおかげで、多指ロボットハンドのリアルタイムの把握動作計画を可能にします。
ただし、学習プロセス中に大規模な検索空間を探索するには、学習ベースの方法が必要です。
検索空間は学習効率の低下を引き起こし、これが実用化の主な障壁となっています。
さらに、オブジェクトがトレーニングされたオブジェクトと同一でない限り、トレーニングされたポリシーには一般化可能な結果がありません。
この研究では、学習ベースの自律的な把握の学習効率と一般化性を向上させるために、階層型報酬メカニズムを備えた新しい物理学誘導深層強化学習を開発します。
従来の観察ベースの把握学習とは異なり、物理学に基づいたメトリクスを利用して手の構造と物体に関連する特徴間の相関関係を伝え、学習効率と成果を向上させます。
さらに、階層型報酬メカニズムにより、ロボットは把握タスクの優先順位の高いコンポーネントを学習できるようになります。
私たちの方法は、3本指のMICOロボットアームを使用したロボットによる把握タスクで検証されています。
結果は、さまざまなロボットの把握タスクにおいて、私たちの方法が標準的な深層強化学習方法よりも優れていることを示しています。
要約(オリジナル)
Learning-based grasping can afford real-time grasp motion planning of multi-fingered robotics hands thanks to its high computational efficiency. However, learning-based methods are required to explore large search spaces during the learning process. The search space causes low learning efficiency, which has been the main barrier to its practical adoption. In addition, the trained policy lacks a generalizable outcome unless objects are identical to the trained objects. In this work, we develop a novel Physics-Guided Deep Reinforcement Learning with a Hierarchical Reward Mechanism to improve learning efficiency and generalizability for learning-based autonomous grasping. Unlike conventional observation-based grasp learning, physics-informed metrics are utilized to convey correlations between features associated with hand structures and objects to improve learning efficiency and outcomes. Further, the hierarchical reward mechanism enables the robot to learn prioritized components of the grasping tasks. Our method is validated in robotic grasping tasks with a 3-finger MICO robot arm. The results show that our method outperformed the standard Deep Reinforcement Learning methods in various robotic grasping tasks.
arxiv情報
著者 | Yunsik Jung,Lingfeng Tao,Michael Bowman,Jiucai Zhang,Xiaoli Zhang |
発行日 | 2023-07-23 23:52:45+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google