要約
人間は計画を立てる際に目標の状態を想像し、その目標に合わせて行動を実行することができます。
この研究では、高精度のピック アンド プレイス タスクを解決するための新しいマルチタスク キーフレーム ポリシー ネットワークである Imagination Policy を提案します。
Imagination Policy は、アクションを直接学習するのではなく、点群を生成して望ましい状態を想像し、その後、厳格なアクション推定を使用してアクションに変換します。
これにより、アクション推論がローカル生成タスクに変換されます。
生成プロセスのタスクの基礎となるピックアンドプレイスの対称性を活用し、非常に高いサンプル効率と目に見えない構成への汎用性を実現します。
最後に、RLbench ベンチマークでさまざまなタスクにわたる最先端のパフォーマンスをいくつかの強力なベースラインと比較して実証し、実際のロボットでのアプローチを検証します。
要約(オリジナル)
Humans can imagine goal states during planning and perform actions to match those goals. In this work, we propose Imagination Policy, a novel multi-task key-frame policy network for solving high-precision pick and place tasks. Instead of learning actions directly, Imagination Policy generates point clouds to imagine desired states which are then translated to actions using rigid action estimation. This transforms action inference into a local generative task. We leverage pick and place symmetries underlying the tasks in the generation process and achieve extremely high sample efficiency and generalizability to unseen configurations. Finally, we demonstrate state-of-the-art performance across various tasks on the RLbench benchmark compared with several strong baselines and validate our approach on a real robot.
arxiv情報
著者 | Haojie Huang,Karl Schmeckpeper,Dian Wang,Ondrej Biza,Yaoyao Qian,Haotian Liu,Mingxi Jia,Robert Platt,Robin Walters |
発行日 | 2024-11-30 17:40:26+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google