LocoMuJoCo: A Comprehensive Imitation Learning Benchmark for Locomotion


模倣学習 (IL) は、身体化されたエージェントの機敏な移動を可能にする大きな可能性を秘めています。
移動のための IL の研究を進めるために、IL アルゴリズムの厳密な評価と比較を容易にするように設計された新しいベンチマークを紹介します。
このベンチマークは、四足動物、二足動物、筋骨格系の人体モデルを含む多様な環境セットを網羅しており、それぞれの環境に実際のノイズの多いモーション キャプチャ データ、グラウンド トゥルース エキスパート データ、グラウンド トゥルースの次善データなどの包括的なデータセットが付属しており、環境全体にわたる評価が可能です。
最後に、タスクごとに手作りのメトリクスを提供し、評価を容易にし、迅速なベンチマークを可能にする最先端のベースライン アルゴリズムを備えたベンチマークを出荷します。


Imitation Learning (IL) holds great promise for enabling agile locomotion in embodied agents. However, many existing locomotion benchmarks primarily focus on simplified toy tasks, often failing to capture the complexity of real-world scenarios and steering research toward unrealistic domains. To advance research in IL for locomotion, we present a novel benchmark designed to facilitate rigorous evaluation and comparison of IL algorithms. This benchmark encompasses a diverse set of environments, including quadrupeds, bipeds, and musculoskeletal human models, each accompanied by comprehensive datasets, such as real noisy motion capture data, ground truth expert data, and ground truth sub-optimal data, enabling evaluation across a spectrum of difficulty levels. To increase the robustness of learned agents, we provide an easy interface for dynamics randomization and offer a wide range of partially observable tasks to train agents across different embodiments. Finally, we provide handcrafted metrics for each task and ship our benchmark with state-of-the-art baseline algorithms to ease evaluation and enable fast benchmarking.


著者 Firas Al-Hafez,Guoping Zhao,Jan Peters,Davide Tateo
発行日 2023-11-30 17:47:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク