ReplaceAnything3D:Text-Guided 3D Scene Editing with Compositional Neural Radiance Fields

要約

ReplaceAnything3D モデル (RAM3D) を紹介します。これは、シーン内の特定のオブジェクトの置換を可能にする、新しいテキスト ガイド付き 3D シーン編集方法です。
シーンのマルチビュー画像、置換するオブジェクトを説明するテキスト プロンプト、および新しいオブジェクトを説明するテキスト プロンプトを考慮すると、消去と置換のアプローチにより、シーン全体で 3D の一貫性を維持しながら、シーン内のオブジェクトを新しく生成されたコンテンツと効果的に交換できます。
複数の視点。
ReplaceAnything3D をさまざまなリアルな 3D シーンに適用することで、ReplaceAnything3D の多用途性を実証し、全体の整合性に影響を与えることなくシーンの残りの部分とうまく統合される変更された前景オブジェクトの結果を示します。

要約(オリジナル)

We introduce ReplaceAnything3D model (RAM3D), a novel text-guided 3D scene editing method that enables the replacement of specific objects within a scene. Given multi-view images of a scene, a text prompt describing the object to replace, and a text prompt describing the new object, our Erase-and-Replace approach can effectively swap objects in the scene with newly generated content while maintaining 3D consistency across multiple viewpoints. We demonstrate the versatility of ReplaceAnything3D by applying it to various realistic 3D scenes, showcasing results of modified foreground objects that are well-integrated with the rest of the scene without affecting its overall integrity.

arxiv情報

著者 Edward Bartrum,Thu Nguyen-Phuoc,Chris Xie,Zhengqin Li,Numair Khan,Armen Avetisyan,Douglas Lanman,Lei Xiao
発行日 2024-01-31 15:02:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.GR パーマリンク