Towards Generalist Robots: A Promising Paradigm via Generative Simulation


この文書の目的は、著者らの興奮をコミュニティと共有し、ロボット工学と AI における有望な研究の方向性を強調することです。
著者らは、提案されたパラダイムが、ロボット研究の長年の目標、つまりロボット、または身体化された AI エージェントをより広範に工場以外の現実世界のさまざまな環境に配置して、多様なタスクを実行するという目標を達成するための実現可能な道であると信じています。
これらのモデルを直接使用または適応させて低レベルのポリシーやアクションを生成するのではなく、完全に自動化された生成パイプライン (生成シミュレーションと呼ばれる) を提唱しています。このパイプラインでは、これらのモデルを使用して多様なタスク、シーン、トレーニング監視を大規模に生成し、それによってスケールを調整します。


This document serves as a position paper that outlines the authors’ vision for a potential pathway towards generalist robots. The purpose of this document is to share the excitement of the authors with the community and highlight a promising research direction in robotics and AI. The authors believe the proposed paradigm is a feasible path towards accomplishing the long-standing goal of robotics research: deploying robots, or embodied AI agents more broadly, in various non-factory real-world settings to perform diverse tasks. This document presents a specific idea for mining knowledge in the latest large-scale foundation models for robotics research. Instead of directly using or adapting these models to produce low-level policies and actions, it advocates for a fully automated generative pipeline (termed as generative simulation), which uses these models to generate diversified tasks, scenes and training supervisions at scale, thereby scaling up low-level skill learning and ultimately leading to a foundation model for robotics that empowers generalist robots. The authors are actively pursuing this direction, but in the meantime, they recognize that the ambitious goal of building generalist robots with large-scale policy training demands significant resources such as computing power and hardware, and research groups in academia alone may face severe resource constraints in implementing the entire vision. Therefore, the authors believe sharing their thoughts at this early stage could foster discussions, attract interest towards the proposed pathway and related topics from industry groups, and potentially spur significant technical advancements in the field.


著者 Zhou Xian,Theophile Gervet,Zhenjia Xu,Yi-Ling Qiao,Tsun-Hsuan Wang,Yian Wang
発行日 2023-08-30 00:05:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク