要約
本論文では、機能的操作の文脈でロボット学習を研究するための実世界ベンチマークを提案する。ロボットは、機能的に関連した方法で個々の操作スキルを組み合わせることにより、複雑な長ホライズン行動を達成する必要がある。我々の機能的操作ベンチマーク(FMB)の基本設計原則は、複雑さとアクセシビリティの調和したバランスを重視している。タスクの範囲は意図的に狭く設定されており、管理可能なスケールのモデルやデータセットを効果的に利用して進捗を追跡できるようになっている。同時に、これらのタスクは、重要な一般化の課題を提起するのに十分な多様性を持っている。さらに、このベンチマークは、すべての重要なハードウェアとソフトウェアのコンポーネントを包含し、容易に再現できるように設計されている。この目標を達成するため、FMBは、他の研究者が簡単かつ正確に複製できるように設計された、3Dプリントされたさまざまなオブジェクトで構成されている。オブジェクトは手続き的に生成され、制御された方法で汎化を研究するための原則的な枠組みを提供する。私たちは、把持、再配置、および様々な組み立て動作を含む、基本的な操作スキルに焦点を当てています。FMBは、複雑な多段階操作課題を解決するために、個々のスキルを習得する方法だけでなく、そのようなスキルを組み合わせ、順序付ける方法を評価するために使用することができる。また、提案されたタスクを解くように訓練された一連のポリシーを含む模倣学習フレームワークも提供する。これにより、研究者は、パイプラインの様々な部分を調べるための汎用的なツールキットとして、我々のタスクを利用することができる。例えば、研究者は、把持コントローラのより良い設計を提案し、多段タスクを解くパイプラインの一部として、我々のベースライン再配向と組立ポリシーと組み合わせて評価することができる。我々のデータセット、オブジェクトCADファイル、コード、評価ビデオは、プロジェクトのウェブサイトhttps://functional-manipulation-benchmark.github.io。
要約(オリジナル)
In this paper, we propose a real-world benchmark for studying robotic learning in the context of functional manipulation: a robot needs to accomplish complex long-horizon behaviors by composing individual manipulation skills in functionally relevant ways. The core design principles of our Functional Manipulation Benchmark (FMB) emphasize a harmonious balance between complexity and accessibility. Tasks are deliberately scoped to be narrow, ensuring that models and datasets of manageable scale can be utilized effectively to track progress. Simultaneously, they are diverse enough to pose a significant generalization challenge. Furthermore, the benchmark is designed to be easily replicable, encompassing all essential hardware and software components. To achieve this goal, FMB consists of a variety of 3D-printed objects designed for easy and accurate replication by other researchers. The objects are procedurally generated, providing a principled framework to study generalization in a controlled fashion. We focus on fundamental manipulation skills, including grasping, repositioning, and a range of assembly behaviors. The FMB can be used to evaluate methods for acquiring individual skills, as well as methods for combining and ordering such skills to solve complex, multi-stage manipulation tasks. We also offer an imitation learning framework that includes a suite of policies trained to solve the proposed tasks. This enables researchers to utilize our tasks as a versatile toolkit for examining various parts of the pipeline. For example, researchers could propose a better design for a grasping controller and evaluate it in combination with our baseline reorientation and assembly policies as part of a pipeline for solving multi-stage tasks. Our dataset, object CAD files, code, and evaluation videos can be found on our project website: https://functional-manipulation-benchmark.github.io
arxiv情報
著者 | Jianlan Luo,Charles Xu,Fangchen Liu,Liam Tan,Zipeng Lin,Jeffrey Wu,Pieter Abbeel,Sergey Levine |
発行日 | 2024-09-03 07:59:26+00:00 |
arxivサイト | arxiv_id(pdf) |