要約
ロボットアームを含む実世界の操作データは、一般論的な行動方針を開発する上で極めて重要であるが、既存のデータ収集方法は、高コスト、ハードウェア依存、複雑なセットアップ要件が障害となっているため、そのようなデータは依然として少ない。この研究では、ユニバーサル・マニピュレーション・インターフェイス(UMI)システムを大幅に再設計したFastUMIを紹介します。このFastUMIは、迅速な導入を可能にし、ハードウェアとソフトウェアの統合を簡素化し、実世界のデータ収集において堅牢な性能を実現することで、これらの課題に対処します。UMIと比較して、FastUMIにはいくつかの利点があります:1) 分離されたハードウェア設計を採用し、大規模な機械的変更を組み込むことで、一貫した観測視点を維持しながら、特殊なロボット部品への依存を排除。2) また、複雑なVIO(Visual-Inertial Odometry:視覚慣性オドメトリ)の実装を市販のトラッキングモジュールに置き換えることで、アルゴリズムのパイプラインを洗練させ、精度を維持しながら配備の複雑さを大幅に軽減します。3) FastUMIは、データ収集、検証、および確立された模倣学習アルゴリズムと新しく開発された模倣学習アルゴリズムの両方との統合のためのエコシステムを含み、政策学習の進歩を加速します。さらに、22の日常的なタスクにまたがる10,000を超える実世界の実演軌跡の高品質データセットをオープンソース化し、これまでで最も多様なUMI類似データセットの1つを形成しています。実験結果は、FastUMIが迅速な展開を容易にし、運用コストと労働需要を削減し、多様な操作シナリオにわたって堅牢な性能を維持することで、スケーラブルなデータ駆動型ロボット学習を促進することを確認しています。
要約(オリジナル)
Real-world manipulation data involving robotic arms is crucial for developing generalist action policies, yet such data remains scarce since existing data collection methods are hindered by high costs, hardware dependencies, and complex setup requirements. In this work, we introduce FastUMI, a substantial redesign of the Universal Manipulation Interface (UMI) system that addresses these challenges by enabling rapid deployment, simplifying hardware-software integration, and delivering robust performance in real-world data acquisition. Compared with UMI, FastUMI has several advantages: 1) It adopts a decoupled hardware design and incorporates extensive mechanical modifications, removing dependencies on specialized robotic components while preserving consistent observation perspectives. 2) It also refines the algorithmic pipeline by replacing complex Visual-Inertial Odometry (VIO) implementations with an off-the-shelf tracking module, significantly reducing deployment complexity while maintaining accuracy. 3) FastUMI includes an ecosystem for data collection, verification, and integration with both established and newly developed imitation learning algorithms, accelerating policy learning advancement. Additionally, we have open-sourced a high-quality dataset of over 10,000 real-world demonstration trajectories spanning 22 everyday tasks, forming one of the most diverse UMI-like datasets to date. Experimental results confirm that FastUMI facilitates rapid deployment, reduces operational costs and labor demands, and maintains robust performance across diverse manipulation scenarios, thereby advancing scalable data-driven robotic learning.
arxiv情報
著者 | Zhaxizhuoma,Kehui Liu,Chuyue Guan,Zhongjie Jia,Ziniu Wu,Xin Liu,Tianyu Wang,Shuai Liang,Pengan Chen,Pingrui Zhang,Haoming Song,Delin Qu,Dong Wang,Zhigang Wang,Nieqing Cao,Yan Ding,Bin Zhao,Xuelong Li |
発行日 | 2025-02-01 06:32:46+00:00 |
arxivサイト | arxiv_id(pdf) |