要約
一般化可能な操作スキルを開発することは、身体化された AI における中心的な課題です。
これには、オブジェクトの形状、密度、摩擦係数、ロボットにかかる力などの外乱の変動を含む、さまざまなタスク構成にわたる一般化が含まれます。
Rapid Motor Adaptation (RMA) は、この課題に対する有望なソリューションを提供します。
それは、オブジェクトの質量や形状など、エージェントのタスクのパフォーマンスに影響を与える必須の隠れた変数は、エージェントの行動と固有受容履歴から効果的に推論できると仮定しています。
移動と手の回転における RMA からインスピレーションを得て、私たちは奥行き知覚を使用して、さまざまな操作タスクでの迅速な運動適応に合わせたエージェントを開発します。
私たちは、Maniskill2 ベンチマークからの 4 つの難しいタスク、つまり、YCB および EGAD データセットからの数百のオブジェクトを使用したピック アンド プレイス操作、正確な位置と向きでのペグ挿入、カスタマイズされたさまざまな蛇口とハンドルの操作についてエージェントを評価しました。
環境の変化。
経験的な結果は、当社のエージェントが自動ドメインランダム化やビジョンベースのポリシーなどの最先端の手法を上回り、より優れた汎化パフォーマンスとサンプル効率を獲得していることを示しています。
要約(オリジナル)
Developing generalizable manipulation skills is a core challenge in embodied AI. This includes generalization across diverse task configurations, encompassing variations in object shape, density, friction coefficient, and external disturbances such as forces applied to the robot. Rapid Motor Adaptation (RMA) offers a promising solution to this challenge. It posits that essential hidden variables influencing an agent’s task performance, such as object mass and shape, can be effectively inferred from the agent’s action and proprioceptive history. Drawing inspiration from RMA in locomotion and in-hand rotation, we use depth perception to develop agents tailored for rapid motor adaptation in a variety of manipulation tasks. We evaluated our agents on four challenging tasks from the Maniskill2 benchmark, namely pick-and-place operations with hundreds of objects from the YCB and EGAD datasets, peg insertion with precise position and orientation, and operating a variety of faucets and handles, with customized environment variations. Empirical results demonstrate that our agents surpass state-of-the-art methods like automatic domain randomization and vision-based policies, obtaining better generalization performance and sample efficiency.
arxiv情報
著者 | Yichao Liang,Kevin Ellis,João Henriques |
発行日 | 2024-03-29 16:39:28+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google