Open-Source Reinforcement Learning Environments Implemented in MuJoCo with Franka Manipulator

要約

この論文では、MuJoCo Menagerie の Franka Emika Panda アームを備えた MuJoCo 物理エンジン上で開発された 3 つのオープンソース強化学習環境を紹介します。
プッシュ、スライド、ピックアンドプレイスという 3 つの代表的なタスクは、Gymnasium のコアを継承する Gymnasium Robotics API を通じて実装されます。
スパースバイナリ報酬とデンス報酬の両方がサポートされており、観察空間には、複数目標強化学習フレームワークに従うための望ましい目標と達成された目標のキーが含まれています。
3 つの異なるオフポリシー アルゴリズムを使用してシミュレーション属性を検証し、すべてのタスクの忠実性を確認し、ベンチマーク結果も示します。
各環境とタスクは明確な方法で定義され、環境を変更するための主なパラメータは主な違いを反映するために保存されます。
すべての環境を含むリポジトリは、https://github.com/zichunxx/panda_mujoco_gym で入手できます。

要約(オリジナル)

This paper presents three open-source reinforcement learning environments developed on the MuJoCo physics engine with the Franka Emika Panda arm in MuJoCo Menagerie. Three representative tasks, push, slide, and pick-and-place, are implemented through the Gymnasium Robotics API, which inherits from the core of Gymnasium. Both the sparse binary and dense rewards are supported, and the observation space contains the keys of desired and achieved goals to follow the Multi-Goal Reinforcement Learning framework. Three different off-policy algorithms are used to validate the simulation attributes to ensure the fidelity of all tasks, and benchmark results are also given. Each environment and task are defined in a clean way, and the main parameters for modifying the environment are preserved to reflect the main difference. The repository, including all environments, is available at https://github.com/zichunxx/panda_mujoco_gym.

arxiv情報

著者 Zichun Xu,Yuntao Li,Xiaohang Yang,Zhiyuan Zhao,Lei Zhuang,Jingdong Zhao
発行日 2024-01-11 07:59:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク