ASID: Active Exploration for System Identification in Robotic Manipulation


一方、正確なシミュレーターを活用したモデルベースの制御技術は、これらの課題を回避し、大量の安価なシミュレーション データを使用して、現実世界に効果的に移行できるコントローラーを学習できます。
このようなモデルベースの手法の課題は、適切なシミュレーション アセットと物理パラメーターの両方の仕様を必要とする、非常に正確なシミュレーションの要件です。
この研究では、少量の実世界データを活用してシミュレーション モデルを自律的に改良し、実世界に展開できる正確な制御戦略を計画できる学習システムを提案します。
私たちのアプローチは、現実世界に展開されたときに高品質のデータを収集する効果的な探査ポリシーを設計するために、初期の (おそらく不正確な) シミュレータを利用することに大きく依存しています。
プロジェクトの Web サイト


Model-free control strategies such as reinforcement learning have shown the ability to learn control strategies without requiring an accurate model or simulator of the world. While this is appealing due to the lack of modeling requirements, such methods can be sample inefficient, making them impractical in many real-world domains. On the other hand, model-based control techniques leveraging accurate simulators can circumvent these challenges and use a large amount of cheap simulation data to learn controllers that can effectively transfer to the real world. The challenge with such model-based techniques is the requirement for an extremely accurate simulation, requiring both the specification of appropriate simulation assets and physical parameters. This requires considerable human effort to design for every environment being considered. In this work, we propose a learning system that can leverage a small amount of real-world data to autonomously refine a simulation model and then plan an accurate control strategy that can be deployed in the real world. Our approach critically relies on utilizing an initial (possibly inaccurate) simulator to design effective exploration policies that, when deployed in the real world, collect high-quality data. We demonstrate the efficacy of this paradigm in identifying articulation, mass, and other physical parameters in several challenging robotic manipulation tasks, and illustrate that only a small amount of real-world data can allow for effective sim-to-real transfer. Project website at


著者 Marius Memmel,Andrew Wagenmaker,Chuning Zhu,Patrick Yin,Dieter Fox,Abhishek Gupta
発行日 2024-04-18 16:35:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY パーマリンク