LucidDreamer: Towards High-Fidelity Text-to-3D Generation via Interval Score Matching


テキストから 3D への生成における最近の進歩は、生成モデルにおける重要なマイルストーンとなり、現実世界のさまざまなシナリオにわたって想像力豊かな 3D アセットを作成するための新たな可能性を解き放ちます。
テキストから 3D への生成における最近の進歩は期待できますが、詳細で高品質な 3D モデルのレンダリングには不十分なことがよくあります。
多くのメソッドがスコア蒸留サンプリング (SDS) に基づいているため、この問題は特に一般的です。
この論文では、SDS の顕著な欠陥、つまり 3D モデルに一貫性のない低品質の更新方向をもたらし、過剰な平滑化効果を引き起こすことを特定しています。
これに対処するために、インターバル スコア マッチング (ISM) と呼ばれる新しいアプローチを提案します。
ISM は、決定論的な拡散軌道を採用し、間隔ベースのスコア マッチングを利用して過度の平滑化を防止します。
さらに、3D ガウス スプラッティングをテキストから 3D への生成パイプラインに組み込みます。


The recent advancements in text-to-3D generation mark a significant milestone in generative models, unlocking new possibilities for creating imaginative 3D assets across various real-world scenarios. While recent advancements in text-to-3D generation have shown promise, they often fall short in rendering detailed and high-quality 3D models. This problem is especially prevalent as many methods base themselves on Score Distillation Sampling (SDS). This paper identifies a notable deficiency in SDS, that it brings inconsistent and low-quality updating direction for the 3D model, causing the over-smoothing effect. To address this, we propose a novel approach called Interval Score Matching (ISM). ISM employs deterministic diffusing trajectories and utilizes interval-based score matching to counteract over-smoothing. Furthermore, we incorporate 3D Gaussian Splatting into our text-to-3D generation pipeline. Extensive experiments show that our model largely outperforms the state-of-the-art in quality and training efficiency.


著者 Yixun Liang,Xin Yang,Jiantao Lin,Haodong Li,Xiaogang Xu,Yingcong Chen
発行日 2023-11-22 16:54:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV, cs.GR, cs.MM パーマリンク