Meta-World+: An Improved, Standardized, RL Benchmark

要約

Meta-Worldは、多様なスキルを同時に習得することに挑戦しているマルチタスクおよびメタの強化学習エージェントの評価に広く使用されています。
しかし、その導入以来、アルゴリズムの公正な比較を阻害する多くの文書化されていない変更がありました。
この作業は、これらの結果を文献から明確にしようとすると同時に、Meta-Worldの過去のバージョンを活用して、マルチタスクとメタの強化学習ベンチマーク設計に関する洞察を提供するよう努めています。
このプロセスを通じて、過去の結果の完全な再現性を持つMeta-World(https://github.com/farama-foundation/metaworld/)の新しいオープンソースバージョンをリリースします。

要約(オリジナル)

Meta-World is widely used for evaluating multi-task and meta-reinforcement learning agents, which are challenged to master diverse skills simultaneously. Since its introduction however, there have been numerous undocumented changes which inhibit a fair comparison of algorithms. This work strives to disambiguate these results from the literature, while also leveraging the past versions of Meta-World to provide insights into multi-task and meta-reinforcement learning benchmark design. Through this process we release a new open-source version of Meta-World (https://github.com/Farama-Foundation/Metaworld/) that has full reproducibility of past results, is more technically ergonomic, and gives users more control over the tasks that are included in a task set.

arxiv情報

著者 Reginald McLean,Evangelos Chatzaroulas,Luc McCutcheon,Frank Röder,Tianhe Yu,Zhanpeng He,K. R. Zentner,Ryan Julian,J K Terry,Isaac Woungang,Nariman Farsad,Pablo Samuel Castro
発行日 2025-05-16 14:24:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク