marl-jax: Multi-Agent Reinforcement Leaning Framework

要約

強化学習 (RL) の最近の進歩により、多くのエキサイティングなアプリケーションが誕生しました。
これらの進歩は、アルゴリズムとエンジニアリングの両方の改善によって促進され、その結果、RL エージェントのトレーニングが高速化されました。
エージェントの社会的一般化を訓練および評価するためのマルチエージェント強化学習ソフトウェア パッケージ marl-jax を紹介します。
このパッケージは、マルチエージェント環境でエージェント集団をトレーニングし、多様なバックグラウンド エージェントに汎用化する能力を評価するために設計されています。
これは DeepMind の JAX エコシステム~\cite{deepmind2020jax} の上に構築されており、DeepMind によって開発された RL エコシステムを活用しています。
私たちのフレームワーク marl-jax は、複数のエージェントが同時に動作する、協調的かつ競合的な環境で動作することができます。
このパッケージは、母集団をトレーニングし、その汎化能力を評価するための、直感的でユーザーフレンドリーなコマンドラインインターフェイスを提供します。
結論として、marl-jax は、MARL の文脈における社会的一般化の探求に興味のある研究者にとって貴重なリソースを提供します。
marl-jax のオープンソース コードは、\href{https://github.com/kinalmehta/marl-jax}{https://github.com/kinalmehta/marl-jax} から入手できます。

要約(オリジナル)

Recent advances in Reinforcement Learning (RL) have led to many exciting applications. These advancements have been driven by improvements in both algorithms and engineering, which have resulted in faster training of RL agents. We present marl-jax, a multi-agent reinforcement learning software package for training and evaluating social generalization of the agents. The package is designed for training a population of agents in multi-agent environments and evaluating their ability to generalize to diverse background agents. It is built on top of DeepMind’s JAX ecosystem~\cite{deepmind2020jax} and leverages the RL ecosystem developed by DeepMind. Our framework marl-jax is capable of working in cooperative and competitive, simultaneous-acting environments with multiple agents. The package offers an intuitive and user-friendly command-line interface for training a population and evaluating its generalization capabilities. In conclusion, marl-jax provides a valuable resource for researchers interested in exploring social generalization in the context of MARL. The open-source code for marl-jax is available at: \href{https://github.com/kinalmehta/marl-jax}{https://github.com/kinalmehta/marl-jax}

arxiv情報

著者 Kinal Mehta,Anuj Mahajan,Pawan Kumar
発行日 2023-07-25 16:12:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.MA パーマリンク