要約
永続的な 3D シーン生成のためのモジュール化されたフレームワークである WonderJourney を紹介します。
単一タイプのシーンに焦点を当てたビュー生成に関するこれまでの研究とは異なり、ユーザーが指定した任意の場所 (テキストの説明または画像によって) から開始し、多様でありながら一貫して接続された 3D シーンの長いシーケンスを通る旅を生成します。
LLM を利用してこの旅のシーンのテキストによる説明を生成し、テキスト駆動の点群生成パイプラインを利用して説得力のある一貫した 3D シーンのシーケンスを作成し、大規模な VLM を利用して生成されたシーンを検証します。
さまざまなシーンの種類やスタイルにわたって、説得力のある多様なビジュアル結果を示し、想像上の「ワンダージャーニー」を形成します。
プロジェクトウェブサイト:https://kovenyu.com/WonderJourney/
要約(オリジナル)
We introduce WonderJourney, a modularized framework for perpetual 3D scene generation. Unlike prior work on view generation that focuses on a single type of scenes, we start at any user-provided location (by a text description or an image) and generate a journey through a long sequence of diverse yet coherently connected 3D scenes. We leverage an LLM to generate textual descriptions of the scenes in this journey, a text-driven point cloud generation pipeline to make a compelling and coherent sequence of 3D scenes, and a large VLM to verify the generated scenes. We show compelling, diverse visual results across various scene types and styles, forming imaginary ‘wonderjourneys’. Project website: https://kovenyu.com/WonderJourney/
arxiv情報
著者 | Hong-Xing Yu,Haoyi Duan,Junhwa Hur,Kyle Sargent,Michael Rubinstein,William T. Freeman,Forrester Cole,Deqing Sun,Noah Snavely,Jiajun Wu,Charles Herrmann |
発行日 | 2024-04-12 16:47:05+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google