Learning Extrinsic Dexterity with Parameterized Manipulation Primitives

要約

実用的なロボット把持問題の多くは、把持する対象物が環境などによってすべて遮られていることを特徴としています。このような場合、単発の把持計画は必ず失敗します。その代わりに、まず物体を把持可能な形状に操作する必要がある。我々は、環境を利用して物体の姿勢を変化させる一連の動作を学習することで、この問題を解決する。具体的には、学習されたパラメータ化された操作プリミティブのシーケンスを組み合わせるために、階層的強化学習を採用する。低レベルの操作ポリシーを学習することで、我々のアプローチは、物体、グリッパー、環境間の相互作用を利用して物体の状態を制御することができる。このような複雑な動作を解析的に設計することは、制御されていない条件下では不可能である。解析的アプローチには、相互作用と接触ダイナミクスの正確な物理モデリングが必要だからである。対照的に、我々は、物体検出、姿勢推定、コントローラの手動設計を必要とせず、奥行き知覚データから直接動作する階層的な政策モデルを学習する。我々は、制約のあるテーブル上の作業空間から、様々な重量、形状、摩擦特性を持つ箱型の物体をピッキングすることで、本アプローチを評価する。本手法は、実際のロボットに移植可能であり、実験試行の98%で物体ピッキングタスクを成功させることができた。

要約(オリジナル)

Many practically relevant robot grasping problems feature a target object for which all grasps are occluded, e.g., by the environment. Single-shot grasp planning invariably fails in such scenarios. Instead, it is necessary to first manipulate the object into a configuration that affords a grasp. We solve this problem by learning a sequence of actions that utilize the environment to change the object’s pose. Concretely, we employ hierarchical reinforcement learning to combine a sequence of learned parameterized manipulation primitives. By learning the low-level manipulation policies, our approach can control the object’s state through exploiting interactions between the object, the gripper, and the environment. Designing such a complex behavior analytically would be infeasible under uncontrolled conditions, as an analytic approach requires accurate physical modeling of the interaction and contact dynamics. In contrast, we learn a hierarchical policy model that operates directly on depth perception data, without the need for object detection, pose estimation, or manual design of controllers. We evaluate our approach on picking box-shaped objects of various weight, shape, and friction properties from a constrained table-top workspace. Our method transfers to a real robot and is able to successfully complete the object picking task in 98\% of experimental trials.

arxiv情報

著者 Shih-Min Yang,Martin Magnusson,Johannes A. Stork,Todor Stoyanov
発行日 2023-11-02 20:32:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, cs.RO パーマリンク