Efficient Training of Generalizable Visuomotor Policies via Control-Aware Augmentation

要約

一般化の改善は、具体化されたAIの重要な課題の1つです。この場合、多様なシナリオ全体で大規模なデータセットを取得するのに費用がかかります。
収穫や反転などの従来の弱い増強は、新しい環境でのモデルのパフォーマンスを改善するには不十分です。
既存のデータ増強方法は、多くの場合、画像のタスク関連情報を破壊し、パフォーマンスを低下させる可能性があります。
これらの課題を克服するために、Eagleを紹介します。これは、(1)自己監視関連マスクを通じて特定された制御関連の領域のみを適用することにより、既存の方法を改善することにより、既存の方法を改善する一般化可能な視覚運動ポリシーの効率的なトレーニングフレームワークであり、(2)、学習環境に浸透しているため、de蒸気の環境に駆られます。
微調整。
DMControl一般化ベンチマーク、強化されたロボット操作の注意散漫ベンチマーク、長いシーケンシャル引き出しオープニングタスクなど、3つのドメインでの包括的な実験により、メソッドの有効性が検証されます。

要約(オリジナル)

Improving generalization is one key challenge in embodied AI, where obtaining large-scale datasets across diverse scenarios is costly. Traditional weak augmentations, such as cropping and flipping, are insufficient for improving a model’s performance in new environments. Existing data augmentation methods often disrupt task-relevant information in images, potentially degrading performance. To overcome these challenges, we introduce EAGLE, an efficient training framework for generalizable visuomotor policies that improves upon existing methods by (1) enhancing generalization by applying augmentation only to control-related regions identified through a self-supervised control-aware mask and (2) improving training stability and efficiency by distilling knowledge from an expert to a visuomotor student policy, which is then deployed to unseen environments without further fine-tuning. Comprehensive experiments on three domains, including the DMControl Generalization Benchmark, the enhanced Robot Manipulation Distraction Benchmark, and a long-sequential drawer-opening task, validate the effectiveness of our method.

arxiv情報

著者 Yinuo Zhao,Kun Wu,Tianjiao Yi,Zhiyuan Xu,Xiaozhu Ju,Zhengping Che,Chi Harold Liu,Jian Tang
発行日 2025-03-21 08:19:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク