EdgeRunner: Auto-regressive Auto-encoder for Artistic Mesh Generation

要約

現在の自己回帰メッシュ生成方法には、不完全さ、不十分な詳細、貧弱な一般化などの問題があります。
この論文では、$512^3$ の空間解像度で最大 4,000 の面を持つ高品質の 3D メッシュを生成できる自動回帰自動エンコーダ (ArAE) モデルを提案します。
三角形メッシュを 1D トークン シーケンスに効率的に圧縮し、トレーニング効率を大幅に向上させる、新しいメッシュ トークン化アルゴリズムを導入します。
さらに、私たちのモデルは可変長の三角形メッシュを固定長の潜在空間に圧縮するため、潜在拡散モデルをトレーニングして一般化を向上させることができます。
広範な実験により、点群と画像条件付きメッシュ生成タスクの両方において、モデルの優れた品質、多様性、一般化機能が実証されました。

要約(オリジナル)

Current auto-regressive mesh generation methods suffer from issues such as incompleteness, insufficient detail, and poor generalization. In this paper, we propose an Auto-regressive Auto-encoder (ArAE) model capable of generating high-quality 3D meshes with up to 4,000 faces at a spatial resolution of $512^3$. We introduce a novel mesh tokenization algorithm that efficiently compresses triangular meshes into 1D token sequences, significantly enhancing training efficiency. Furthermore, our model compresses variable-length triangular meshes into a fixed-length latent space, enabling training latent diffusion models for better generalization. Extensive experiments demonstrate the superior quality, diversity, and generalization capabilities of our model in both point cloud and image-conditioned mesh generation tasks.

arxiv情報

著者 Jiaxiang Tang,Zhaoshuo Li,Zekun Hao,Xian Liu,Gang Zeng,Ming-Yu Liu,Qinsheng Zhang
発行日 2024-09-26 17:55:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク