RL-ViGen: A Reinforcement Learning Benchmark for Visual Generalization

要約

視覚強化学習 (Visual RL) は、高次元の観察と組み合わせることで、分布外の一般化という長年の課題に一貫して直面してきました。
視覚的汎化問題を解決することを目的としたアルゴリズムに焦点が当てられているにもかかわらず、既存のベンチマークは孤立したタスクと汎化カテゴリに制限されており、エージェントの視覚的汎化能力の包括的な評価を損なっているため、悪魔が存在すると私たちは主張します。
このギャップを埋めるために、RL-ViGen を導入します。これは、視覚的一般化のための新しい強化学習ベンチマークです。これには、多様なタスクと幅広い一般化タイプが含まれており、それにより、より信頼性の高い結論の導出が容易になります。
さらに、RL-ViGen は、最新の一般化ビジュアル RL アルゴリズムを統一フレームワークに組み込んでおり、実験結果では、既存の単一のアルゴリズムがタスク全体に普遍的に普及していないことが示されています。
私たちの願望は、RL-ViGen がこの分野の触媒として機能し、現実世界のシナリオに適した普遍的な視覚一般化 RL エージェントの将来の作成のための基礎を築くことです。
コードと実装されたアルゴリズムへのアクセスは、https://gemcollector.github.io/RL-ViGen/ で提供されます。

要約(オリジナル)

Visual Reinforcement Learning (Visual RL), coupled with high-dimensional observations, has consistently confronted the long-standing challenge of out-of-distribution generalization. Despite the focus on algorithms aimed at resolving visual generalization problems, we argue that the devil is in the existing benchmarks as they are restricted to isolated tasks and generalization categories, undermining a comprehensive evaluation of agents’ visual generalization capabilities. To bridge this gap, we introduce RL-ViGen: a novel Reinforcement Learning Benchmark for Visual Generalization, which contains diverse tasks and a wide spectrum of generalization types, thereby facilitating the derivation of more reliable conclusions. Furthermore, RL-ViGen incorporates the latest generalization visual RL algorithms into a unified framework, under which the experiment results indicate that no single existing algorithm has prevailed universally across tasks. Our aspiration is that RL-ViGen will serve as a catalyst in this area, and lay a foundation for the future creation of universal visual generalization RL agents suitable for real-world scenarios. Access to our code and implemented algorithms is provided at https://gemcollector.github.io/RL-ViGen/.

arxiv情報

著者 Zhecheng Yuan,Sizhe Yang,Pu Hua,Can Chang,Kaizhe Hu,Huazhe Xu
発行日 2023-09-26 10:14:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク