RRLS : Robust Reinforcement Learning Suite

要約

堅牢な強化学習とは、一連の敵対的な環境に対して最適な最悪の場合のパフォーマンスを提供する学習制御ポリシーの問題です。
これは、環境の不確実性が蔓延する現実世界のシナリオにアルゴリズムを導入するための重要な要素であり、標準化されたベンチマークのセットがないにもかかわらず、コミュニティで長年注目されてきました。
この貢献は、このギャップを埋めることに努めています。
Mujoco 環境に基づくベンチマーク スイートである Robust Reinforcement Learning Suite (RRLS) を紹介します。
RRLS は、トレーニングと評価用に 2 種類の不確実性セットを備えた 6 つの連続制御タスクを提供します。
私たちのベンチマークは、堅牢な強化学習タスクを標準化し、再現可能で比較可能な実験、特に RRLS の使用を実証する最近の最先端の貢献による実験を容易にすることを目的としています。
また、新しい環境に簡単に拡張できるように設計されています。
ソース コードは \href{https://github.com/SuReLI/RRLS}{https://github.com/SuReLI/RRLS} で入手できます。

要約(オリジナル)

Robust reinforcement learning is the problem of learning control policies that provide optimal worst-case performance against a span of adversarial environments. It is a crucial ingredient for deploying algorithms in real-world scenarios with prevalent environmental uncertainties and has been a long-standing object of attention in the community, without a standardized set of benchmarks. This contribution endeavors to fill this gap. We introduce the Robust Reinforcement Learning Suite (RRLS), a benchmark suite based on Mujoco environments. RRLS provides six continuous control tasks with two types of uncertainty sets for training and evaluation. Our benchmark aims to standardize robust reinforcement learning tasks, facilitating reproducible and comparable experiments, in particular those from recent state-of-the-art contributions, for which we demonstrate the use of RRLS. It is also designed to be easily expandable to new environments. The source code is available at \href{https://github.com/SuReLI/RRLS}{https://github.com/SuReLI/RRLS}.

arxiv情報

著者 Adil Zouitine,David Bertoin,Pierre Clavier,Matthieu Geist,Emmanuel Rachelson
発行日 2024-06-12 16:53:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク