V-IRL: Grounding Virtual Intelligence in Real Life

要約

人間が住む地球と、現代のAIエージェントが作られるデジタル領域との間には、感覚的な溝がある。実世界で人間と同じように感覚し、思考し、柔軟に行動できるAIエージェントを開発するには、デジタル世界と物理世界の間のリアリズムのギャップを埋めることが不可欠です。現実のハードウェアや制御による制約を受けることなく、我々の住む環境と同じように豊かで多様な環境でエージェントを具現化するにはどうすればよいのだろうか?この目的を達成するために、私たちはV-IRLを紹介します。V-IRLは、バーチャルでありながらリアルな環境で、エージェントが現実世界とスケーラブルに相互作用することを可能にするプラットフォームです。私たちのプラットフォームは、様々な実用的なタスクを達成するエージェントを開発するための遊び場であり、知覚、意思決定、実世界データとのインタラクションといった能力の進歩を測定するための広大なテストベッドとして、全世界で利用されています。

要約(オリジナル)

There is a sensory gulf between the Earth that humans inhabit and the digital realms in which modern AI agents are created. To develop AI agents that can sense, think, and act as flexibly as humans in real-world settings, it is imperative to bridge the realism gap between the digital and physical worlds. How can we embody agents in an environment as rich and diverse as the one we inhabit, without the constraints imposed by real hardware and control? Towards this end, we introduce V-IRL: a platform that enables agents to scalably interact with the real world in a virtual yet realistic environment. Our platform serves as a playground for developing agents that can accomplish various practical tasks and as a vast testbed for measuring progress in capabilities spanning perception, decision-making, and interaction with real-world data across the entire globe.

arxiv情報

著者 Jihan Yang,Runyu Ding,Ellis Brown,Xiaojuan Qi,Saining Xie
発行日 2024-02-05 18:59:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CV パーマリンク