ShapeCrafter: A Recursive Text-Conditioned 3D Shape Generation Model


再帰的なテキスト条件付き 3D 形状生成用のニューラル ネットワークである ShapeCrafter を紹介します。
テキスト条件付きの 3D 形状を生成する既存の方法は、テキスト プロンプト全体を消費して、1 つのステップで 3D 形状を生成します。
この再帰的なプロセスを捉えるために、最初のフレーズを条件として 3D 形状分布を生成する方法を導入します。これは、より多くのフレーズが追加されるにつれて徐々に進化します。
既存のデータセットはこのアプローチをトレーニングするには不十分であるため、再帰的な形状生成をサポートする 369K の形状とテキストのペアの大規模なデータセットである Text2Shape++ を提示します。


We present ShapeCrafter, a neural network for recursive text-conditioned 3D shape generation. Existing methods to generate text-conditioned 3D shapes consume an entire text prompt to generate a 3D shape in a single step. However, humans tend to describe shapes recursively-we may start with an initial description and progressively add details based on intermediate results. To capture this recursive process, we introduce a method to generate a 3D shape distribution, conditioned on an initial phrase, that gradually evolves as more phrases are added. Since existing datasets are insufficient for training this approach, we present Text2Shape++, a large dataset of 369K shape-text pairs that supports recursive shape generation. To capture local details that are often used to refine shape descriptions, we build on top of vector-quantized deep implicit functions that generate a distribution of high-quality shapes. Results show that our method can generate shapes consistent with text descriptions, and shapes evolve gradually as more phrases are added. Our method supports shape editing, extrapolation, and can enable new applications in human-machine collaboration for creative design.


著者 Rao Fu,Xiao Zhan,Yiwen Chen,Daniel Ritchie,Srinath Sridhar
発行日 2022-10-13 17:59:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CV パーマリンク