要約
我々は、強化学習 (RL) の研究と応用のための長期的な進化、極めてモジュール化されたオープンソース フレームワークである RLLTE を紹介します。
RLLTE は、一流のアルゴリズム実装を提供するだけでなく、アルゴリズムを開発するためのツールキットとしても機能します。
より具体的には、RLLTE は RL アルゴリズムを活用と探索の観点から完全に分離し、アルゴリズムの開発と進化を加速するための多数のコンポーネントを提供します。
特に、RLLTE は、モデルのトレーニング、評価、展開、ベンチマーク ハブ、および大規模言語モデル (LLM) を活用したコパイロットを含む、完全で豊かなエコシステムを構築する最初の RL フレームワークです。
RLLTE は、RL エンジニアリング実践の標準を設定し、産業界と学術界にとって非常に刺激的なものとなることが期待されています。
要約(オリジナル)
We present RLLTE: a long-term evolution, extremely modular, and open-source framework for reinforcement learning (RL) research and application. Beyond delivering top-notch algorithm implementations, RLLTE also serves as a toolkit for developing algorithms. More specifically, RLLTE decouples the RL algorithms completely from the exploitation-exploration perspective, providing a large number of components to accelerate algorithm development and evolution. In particular, RLLTE is the first RL framework to build a complete and luxuriant ecosystem, which includes model training, evaluation, deployment, benchmark hub, and large language model (LLM)-empowered copilot. RLLTE is expected to set standards for RL engineering practice and be highly stimulative for industry and academia.
arxiv情報
著者 | Mingqi Yuan,Zequn Zhang,Yang Xu,Shihao Luo,Bo Li,Xin Jin,Wenjun Zeng |
発行日 | 2023-09-28 12:30:37+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google