要約
堅牢で一般化可能な世界モデルの学習は、実際の環境で効率的でスケーラブルなロボット制御を可能にするために重要です。
この作業では、複雑で部分的に観察可能な、確率的ダイナミクスを正確にキャプチャする世界モデルを学習するための新しいフレームワークを紹介します。
提案された方法は、ドメイン固有の帰納的バイアスに依存することなく、信頼できる長老の予測を実現するために、二重自動性メカニズムと自己監視トレーニングを採用し、多様なロボットタスク全体の適応性を確保します。
さらに、想像上の環境での効率的なトレーニングと現実世界のシステムでのシームレスな展開のために世界モデルを活用するポリシー最適化フレームワークを提案します。
この作業は、長老の予測、エラーの蓄積、およびSIMからリアルへの転送の課題に対処することにより、モデルベースの強化学習を進めます。
スケーラブルで堅牢なフレームワークを提供することにより、導入された方法は、実際のアプリケーションで適応的で効率的なロボットシステムへの道を開きます。
要約(オリジナル)
Learning robust and generalizable world models is crucial for enabling efficient and scalable robotic control in real-world environments. In this work, we introduce a novel framework for learning world models that accurately capture complex, partially observable, and stochastic dynamics. The proposed method employs a dual-autoregressive mechanism and self-supervised training to achieve reliable long-horizon predictions without relying on domain-specific inductive biases, ensuring adaptability across diverse robotic tasks. We further propose a policy optimization framework that leverages world models for efficient training in imagined environments and seamless deployment in real-world systems. This work advances model-based reinforcement learning by addressing the challenges of long-horizon prediction, error accumulation, and sim-to-real transfer. By providing a scalable and robust framework, the introduced methods pave the way for adaptive and efficient robotic systems in real-world applications.
arxiv情報
著者 | Chenhao Li,Andreas Krause,Marco Hutter |
発行日 | 2025-04-23 14:03:59+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google