要約
非摂食操作(たとえば、制御されたプッシュ/突き刺し)は基礎的なロボットスキルを構成しますが、その学習は、摩擦と賠償を含む複雑な物理的相互作用に対する感受性のために依然として困難です。
堅牢な政策学習と一般化を達成するために、非摂食操作に関与する3D剛体の体のダイナミクスの世界モデルを学び、モデルベースの強化学習に使用することを選択します。
視覚的観測から3Dリジッドボディダイナミカルシステムの効率的なエンドツーエンドの識別を可能にする物理学に基づいた世界モデルであるPIN-WMを提案します。
微分可能な物理シミュレーションを採用すると、PIN-WMは、少数のショットとタスクに依存しない物理的相互作用の軌跡しか得られません。
さらに、PIN-WMは、状態の推定を必要とせずにガウスのスプラッティングによって引き起こされる観察損失で学習されます。
SIM2REALのギャップをブリッジするために、学習したPIN-WMを、物理学を妨害し、パラメーターをレンダリングしてPIN-WMの多様で意味のあるバリエーションを生成するパラメーターをレンダリングする物理的なランダム化を介して、デジタルカズンのグループに変えます。
シミュレーションと現実世界の両方のテストでの広範な評価は、物理学を認識しているデジタルのいとこで強化されたPIN-WMが、SIM2REAL転送で堅牢な非摂取操作スキルを促進し、Real2Sim2realの最先端を上回ることを示しています。
要約(オリジナル)
While non-prehensile manipulation (e.g., controlled pushing/poking) constitutes a foundational robotic skill, its learning remains challenging due to the high sensitivity to complex physical interactions involving friction and restitution. To achieve robust policy learning and generalization, we opt to learn a world model of the 3D rigid body dynamics involved in non-prehensile manipulations and use it for model-based reinforcement learning. We propose PIN-WM, a Physics-INformed World Model that enables efficient end-to-end identification of a 3D rigid body dynamical system from visual observations. Adopting differentiable physics simulation, PIN-WM can be learned with only few-shot and task-agnostic physical interaction trajectories. Further, PIN-WM is learned with observational loss induced by Gaussian Splatting without needing state estimation. To bridge Sim2Real gaps, we turn the learned PIN-WM into a group of Digital Cousins via physics-aware randomizations which perturb physics and rendering parameters to generate diverse and meaningful variations of the PIN-WM. Extensive evaluations on both simulation and real-world tests demonstrate that PIN-WM, enhanced with physics-aware digital cousins, facilitates learning robust non-prehensile manipulation skills with Sim2Real transfer, surpassing the Real2Sim2Real state-of-the-arts.
arxiv情報
著者 | Wenxuan Li,Hang Zhao,Zhiyuan Yu,Yu Du,Qin Zou,Ruizhen Hu,Kai Xu |
発行日 | 2025-04-23 13:27:07+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google