要約
急速に進歩するロボット工学の分野では、双腕の調整と複雑なオブジェクトの操作は、高度な自律システムを開発するために不可欠な機能です。
しかし、多様で高品質な実証データと現実世界に合わせた評価ベンチマークが不足しているため、そのような開発は大幅に制限されています。
これに対処するために、3D 生成基盤モデルと大規模言語モデルを使用して多様な専門家データセットを生成し、双腕ロボット タスクのための現実世界に合わせた評価プラットフォームを提供する、生成デジタル ツイン フレームワークである RoboTwin を紹介します。
具体的には、RoboTwin は単一の 2D 画像からオブジェクトのさまざまなデジタル ツインを作成し、現実的でインタラクティブなシナリオを生成します。
また、オブジェクトの注釈と大規模な言語モデルを組み合わせてタスクを細分化し、空間的制約を決定し、正確なロボット動作コードを生成する、空間関係を認識したコード生成フレームワークも導入されています。
当社のフレームワークは、シミュレートされたデータと実世界のデータの両方を含む包括的なベンチマークを提供し、標準化された評価と、シミュレートされたトレーニングと実世界のパフォーマンスの間のより適切な調整を可能にします。
私たちは、オープンソースの COBOT Magic Robot プラットフォームを使用してアプローチを検証しました。
RoboTwin で生成されたデータで事前トレーニングされ、限られた実世界のサンプルで微調整されたポリシーにより、実世界のみでトレーニングされたモデルと比較して、片腕タスクの成功率が 70% 以上、双腕タスクの成功率が 40% 以上向上します。
データ。
この大幅な改善は、双腕ロボット操作システムの開発と評価を強化する RoboTwin の可能性を示しています。
プロジェクトページ: https://robotwin-benchmark.github.io/early-version/。
要約(オリジナル)
In the rapidly advancing field of robotics, dual-arm coordination and complex object manipulation are essential capabilities for developing advanced autonomous systems. However, the scarcity of diverse, high-quality demonstration data and real-world-aligned evaluation benchmarks severely limits such development. To address this, we introduce RoboTwin, a generative digital twin framework that uses 3D generative foundation models and large language models to produce diverse expert datasets and provide a real-world-aligned evaluation platform for dual-arm robotic tasks. Specifically, RoboTwin creates varied digital twins of objects from single 2D images, generating realistic and interactive scenarios. It also introduces a spatial relation-aware code generation framework that combines object annotations with large language models to break down tasks, determine spatial constraints, and generate precise robotic movement code. Our framework offers a comprehensive benchmark with both simulated and real-world data, enabling standardized evaluation and better alignment between simulated training and real-world performance. We validated our approach using the open-source COBOT Magic Robot platform. Policies pre-trained on RoboTwin-generated data and fine-tuned with limited real-world samples improve the success rate of over 70% for single-arm tasks and over 40% for dual-arm tasks compared to models trained solely on real-world data. This significant improvement demonstrates RoboTwin’s potential to enhance the development and evaluation of dual-arm robotic manipulation systems. Project Page: https://robotwin-benchmark.github.io/early-version/.
arxiv情報
著者 | Yao Mu,Tianxing Chen,Shijia Peng,Zanxin Chen,Zeyu Gao,Yude Zou,Lunkai Lin,Zhiqiang Xie,Ping Luo |
発行日 | 2024-12-16 17:09:58+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google