要約
模倣学習 (IL) は、身体化されたエージェントの機敏な移動を可能にする大きな可能性を秘めています。
しかし、既存の移動ベンチマークの多くは主に単純化されたおもちゃのタスクに焦点を当てており、多くの場合、現実世界のシナリオの複雑さを捉えることができず、非現実的な領域に研究を誘導しています。
移動のための IL の研究を進めるために、IL アルゴリズムの厳密な評価と比較を容易にするように設計された新しいベンチマークを紹介します。
このベンチマークは、四足動物、二足動物、筋骨格系の人体モデルを含む多様な環境セットを網羅しており、それぞれの環境に実際のノイズの多いモーション キャプチャ データ、グラウンド トゥルース エキスパート データ、グラウンド トゥルースの次善データなどの包括的なデータセットが付属しており、環境全体にわたる評価が可能です。
難易度の範囲。
学習されたエージェントの堅牢性を高めるために、動的ランダム化のための簡単なインターフェースを提供し、さまざまな実施形態にわたってエージェントを訓練するための広範囲の部分的に観察可能なタスクを提供します。
最後に、タスクごとに手作りのメトリクスを提供し、評価を容易にし、迅速なベンチマークを可能にする最先端のベースライン アルゴリズムを備えたベンチマークを出荷します。
要約(オリジナル)
Imitation Learning (IL) holds great promise for enabling agile locomotion in embodied agents. However, many existing locomotion benchmarks primarily focus on simplified toy tasks, often failing to capture the complexity of real-world scenarios and steering research toward unrealistic domains. To advance research in IL for locomotion, we present a novel benchmark designed to facilitate rigorous evaluation and comparison of IL algorithms. This benchmark encompasses a diverse set of environments, including quadrupeds, bipeds, and musculoskeletal human models, each accompanied by comprehensive datasets, such as real noisy motion capture data, ground truth expert data, and ground truth sub-optimal data, enabling evaluation across a spectrum of difficulty levels. To increase the robustness of learned agents, we provide an easy interface for dynamics randomization and offer a wide range of partially observable tasks to train agents across different embodiments. Finally, we provide handcrafted metrics for each task and ship our benchmark with state-of-the-art baseline algorithms to ease evaluation and enable fast benchmarking.
arxiv情報
著者 | Firas Al-Hafez,Guoping Zhao,Jan Peters,Davide Tateo |
発行日 | 2023-11-30 17:47:04+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google