要約
高品質のベンチマークは、具体化されたAI研究の基盤であり、長老航海、操作、および再配置タスクの大幅な進歩を可能にします。
ただし、ロボット工学のフロンティアタスクがより高度になるにつれて、シミュレーション速度の高速化、より複雑なテスト環境、およびより大きなデモンストレーションデータセットが必要です。
この目的のために、MS-HABは、低レベルの操作と在宅オブジェクトの再配置のための全体的なベンチマークであるMS-HABを提示します。
まず、ホームアシスタントベンチマーク(HAB)のGPUアクセル化された実装を提供します。
現実的な低レベルのコントロールをサポートし、GPUメモリ使用量の一部での以前の魔法の把握実装の速度を3倍以上に達成します。
第二に、将来の作業を比較するために、広範な強化学習(RL)および模倣学習(IL)ベースラインを訓練します。
最後に、ロボットの行動と安全性の事前定義された基準に一致するRLポリシーから特定のデモンストレーションをサンプリングするためのルールベースの軌道フィルタリングシステムを開発します。
デモンストレーションフィルタリングと高速環境を組み合わせることで、大規模な効率的で制御されたデータ生成が可能になります。
要約(オリジナル)
High-quality benchmarks are the foundation for embodied AI research, enabling significant advancements in long-horizon navigation, manipulation and rearrangement tasks. However, as frontier tasks in robotics get more advanced, they require faster simulation speed, more intricate test environments, and larger demonstration datasets. To this end, we present MS-HAB, a holistic benchmark for low-level manipulation and in-home object rearrangement. First, we provide a GPU-accelerated implementation of the Home Assistant Benchmark (HAB). We support realistic low-level control and achieve over 3x the speed of prior magical grasp implementations at a fraction of the GPU memory usage. Second, we train extensive reinforcement learning (RL) and imitation learning (IL) baselines for future work to compare against. Finally, we develop a rule-based trajectory filtering system to sample specific demonstrations from our RL policies which match predefined criteria for robot behavior and safety. Combining demonstration filtering with our fast environments enables efficient, controlled data generation at scale.
arxiv情報
| 著者 | Arth Shukla,Stone Tao,Hao Su |
| 発行日 | 2025-02-28 10:10:33+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google