Is Sora a World Simulator? A Comprehensive Survey on General World Models and Beyond

要約

一般世界モデルは、人工知能(AGI)の実現に向けた重要な道筋を示すものであり、仮想環境から意思決定システムまで様々な応用の礎となっている。近年では、物理法則を理解しつつシミュレーションを行うSoraモデルの登場が注目を集めている。本サーベイでは、世界モデルの最新動向を包括的に探る。我々の分析では、映像生成における生成的方法論の最前線をナビゲートする。そこでは、ワールドモデルが、非常にリアルな映像コンテンツの合成を促進する極めて重要な構成要素として立ちはだかる。さらに、自律走行ワールドモデルの急成長分野を精査し、交通と都市モビリティの再形成に不可欠な役割を綿密に定義する。さらに、自律型エージェントに導入されたワールドモデルに内在する複雑さを掘り下げ、ダイナミックな環境コンテクストにおけるインテリジェントなインタラクションを可能にするその重大な意義に光を当てる。最後に、ワールドモデルの課題と限界について検討し、その潜在的な将来の方向性について議論する。我々は、このサーベイが研究コミュニティにとって基礎的な参考資料となり、継続的なイノベーションを刺激することを願っている。この調査は、https://github.com/GigaAI-research/General-World-Models-Survey で定期的に更新される予定である。

要約(オリジナル)

General world models represent a crucial pathway toward achieving Artificial General Intelligence (AGI), serving as the cornerstone for various applications ranging from virtual environments to decision-making systems. Recently, the emergence of the Sora model has attained significant attention due to its remarkable simulation capabilities, which exhibits an incipient comprehension of physical laws. In this survey, we embark on a comprehensive exploration of the latest advancements in world models. Our analysis navigates through the forefront of generative methodologies in video generation, where world models stand as pivotal constructs facilitating the synthesis of highly realistic visual content. Additionally, we scrutinize the burgeoning field of autonomous-driving world models, meticulously delineating their indispensable role in reshaping transportation and urban mobility. Furthermore, we delve into the intricacies inherent in world models deployed within autonomous agents, shedding light on their profound significance in enabling intelligent interactions within dynamic environmental contexts. At last, we examine challenges and limitations of world models, and discuss their potential future directions. We hope this survey can serve as a foundational reference for the research community and inspire continued innovation. This survey will be regularly updated at: https://github.com/GigaAI-research/General-World-Models-Survey.

arxiv情報

著者 Zheng Zhu,Xiaofeng Wang,Wangbo Zhao,Chen Min,Nianchen Deng,Min Dou,Yuqi Wang,Botian Shi,Kai Wang,Chi Zhang,Yang You,Zhaoxiang Zhang,Dawei Zhao,Liang Xiao,Jian Zhao,Jiwen Lu,Guan Huang
発行日 2024-05-06 14:37:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク