Learning Extrinsic Dexterity with Parameterized Manipulation Primitives

要約

実際に関連するロボットの把握問題の多くは、環境などによってすべての把握が遮られるターゲット オブジェクトを特徴としています。
このようなシナリオでは、単発の把握計画は必ず失敗します。
代わりに、最初にオブジェクトを操作して、把握できる構成にする必要があります。
この問題は、環境を利用してオブジェクトのポーズを変更する一連のアクションを学習することで解決します。
具体的には、階層型強化学習を使用して、学習されたパラメータ化された操作プリミティブのシーケンスを組み合わせます。
低レベルの操作ポリシーを学習することで、私たちのアプローチは、オブジェクト、グリッパー、環境の間の相互作用を利用してオブジェクトの状態を制御できます。
解析的アプローチには相互作用と接触ダイナミクスの正確な物理モデリングが必要であるため、このような複雑な動作を解析的に設計することは、制御されていない条件下では実行不可能です。
対照的に、物体検出、姿勢推定、コントローラーの手動設計を必要とせずに、奥行き知覚データに直接作用する階層型ポリシー モデルを学習します。
制約されたテーブルトップの作業スペースから、さまざまな重量、形状、摩擦特性を持つ箱型のオブジェクトを選択するアプローチを評価します。
私たちの方法は実際のロボットに移行し、実験試行の 98% で物体ピッキング タスクを正常に完了できます。
補足情報とビデオは、https://shihminyang.github.io/ED-PMP/ でご覧いただけます。

要約(オリジナル)

Many practically relevant robot grasping problems feature a target object for which all grasps are occluded, e.g., by the environment. Single-shot grasp planning invariably fails in such scenarios. Instead, it is necessary to first manipulate the object into a configuration that affords a grasp. We solve this problem by learning a sequence of actions that utilize the environment to change the object’s pose. Concretely, we employ hierarchical reinforcement learning to combine a sequence of learned parameterized manipulation primitives. By learning the low-level manipulation policies, our approach can control the object’s state through exploiting interactions between the object, the gripper, and the environment. Designing such a complex behavior analytically would be infeasible under uncontrolled conditions, as an analytic approach requires accurate physical modeling of the interaction and contact dynamics. In contrast, we learn a hierarchical policy model that operates directly on depth perception data, without the need for object detection, pose estimation, or manual design of controllers. We evaluate our approach on picking box-shaped objects of various weight, shape, and friction properties from a constrained table-top workspace. Our method transfers to a real robot and is able to successfully complete the object picking task in 98\% of experimental trials. Supplementary information and videos can be found at https://shihminyang.github.io/ED-PMP/.

arxiv情報

著者 Shih-Min Yang,Martin Magnusson,Johannes A. Stork,Todor Stoyanov
発行日 2024-05-09 14:35:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク