要約
品質の量を上回るデータ効率の追求は、特に現実世界のデータ収集に関連する高いコストを考えると、ロボット操作の基礎として浮上しています。
個々のデモンストレーションの情報密度を最大化すると、タスクのパフォーマンスを向上させながら、大規模なデータセットへの依存を劇的に減らすことができると提案します。
この目的のために、リアルタイムの双方向性の人間と環境の相互作用を通じてロボットデータの収集を再定義する人間のループ(HIL)フレームワークである敵対的なデータ収集を紹介します。
静的なデモンストレーションを受動的に記録する従来のパイプラインとは異なり、ADCは共同摂動パラダイムを採用します。単一のエピソードでは、敵対的な演算子はオブジェクトの状態、環境条件、言語コマンドを動的に変化させます。
このプロセスは、多様な障害回復行動、構成タスクの変動、環境摂動を最小限のデモンストレーションに圧縮します。
私たちの実験は、ADCトレーニングを受けたモデルが、目に見えないタスク命令に対して優れた組成一般化、知覚摂動に対する堅牢性の強化、および緊急エラー回復機能を達成することを示しています。
驚くべきことに、ADCを介して収集されたデモ巻の20%のみで訓練されたモデルは、完全なデータセットを使用して従来のアプローチを大幅に上回ります。
これらの進歩は、データ中心の学習パラダイムと実用的なロボット展開の間のギャップを埋め尽くし、単に事後処理ではなく戦略的データ収集がスケーラブルで実世界のロボット学習にとって重要であることを示しています。
さらに、敵対的な摂動を伴う現実世界の操作タスクを含む大規模なADCロボットデータセットをキュレーションしています。
このベンチマークは、ロボット模倣学習の進歩を促進するためにオープンソーリングされます。
要約(オリジナル)
The pursuit of data efficiency, where quality outweighs quantity, has emerged as a cornerstone in robotic manipulation, especially given the high costs associated with real-world data collection. We propose that maximizing the informational density of individual demonstrations can dramatically reduce reliance on large-scale datasets while improving task performance. To this end, we introduce Adversarial Data Collection, a Human-in-the-Loop (HiL) framework that redefines robotic data acquisition through real-time, bidirectional human-environment interactions. Unlike conventional pipelines that passively record static demonstrations, ADC adopts a collaborative perturbation paradigm: during a single episode, an adversarial operator dynamically alters object states, environmental conditions, and linguistic commands, while the tele-operator adaptively adjusts actions to overcome these evolving challenges. This process compresses diverse failure-recovery behaviors, compositional task variations, and environmental perturbations into minimal demonstrations. Our experiments demonstrate that ADC-trained models achieve superior compositional generalization to unseen task instructions, enhanced robustness to perceptual perturbations, and emergent error recovery capabilities. Strikingly, models trained with merely 20% of the demonstration volume collected through ADC significantly outperform traditional approaches using full datasets. These advances bridge the gap between data-centric learning paradigms and practical robotic deployment, demonstrating that strategic data acquisition, not merely post-hoc processing, is critical for scalable, real-world robot learning. Additionally, we are curating a large-scale ADC-Robotics dataset comprising real-world manipulation tasks with adversarial perturbations. This benchmark will be open-sourced to facilitate advancements in robotic imitation learning.
arxiv情報
著者 | Siyuan Huang,Yue Liao,Siyuan Feng,Shu Jiang,Si Liu,Hongsheng Li,Maoqing Yao,Guanghui Ren |
発行日 | 2025-03-14 17:59:07+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google