FaceDNeRF: Semantics-Driven Face Reconstruction, Prompt Editing and Relighting with Diffusion Models

要約

1枚の画像から高品質な3D顔を生成する機能は、ビデオ会議、AR/VR、映画業界における高度なビデオ編集など、幅広い用途でますます重要になってきている。本論文では、セマンティック編集とリライティング機能を備えた、単一画像から高品質な顔NeRFを再構成する新しい生成手法である顔拡散NeRF(FaceDNeRF)を提案する。FaceDNeRFは、高解像度の3D GANインバージョンと専門的に訓練された2D潜在拡散モデルを利用しており、ユーザーは明示的な3Dデータを必要とすることなく、ゼロショット学習で顔NeRFを操作・構築することができます。FaceDNeRFは、入念に設計されたイルミネーションと同一性保持損失、およびマルチモーダル事前学習により、編集プロセスにおける比類のない制御をユーザーに提供し、シングルビュー画像、テキストプロンプト、および明示的なターゲット照明のみを使用して顔NeRFを作成および編集することができます。FaceDNeRFの高度な機能は、編集可能な属性のために2Dセグメンテーションマップに依存する既存の2D編集アプローチよりも印象的な結果を生成するように設計されています。実験によると、我々のFaceDNeRFは、最先端の3D顔再構成・編集手法と比較して、非常にリアルな結果と前例のない編集の柔軟性を達成しています。我々のコードはhttps://github.com/BillyXYB/FaceDNeRF。

要約(オリジナル)

The ability to create high-quality 3D faces from a single image has become increasingly important with wide applications in video conferencing, AR/VR, and advanced video editing in movie industries. In this paper, we propose Face Diffusion NeRF (FaceDNeRF), a new generative method to reconstruct high-quality Face NeRFs from single images, complete with semantic editing and relighting capabilities. FaceDNeRF utilizes high-resolution 3D GAN inversion and expertly trained 2D latent-diffusion model, allowing users to manipulate and construct Face NeRFs in zero-shot learning without the need for explicit 3D data. With carefully designed illumination and identity preserving loss, as well as multi-modal pre-training, FaceDNeRF offers users unparalleled control over the editing process enabling them to create and edit face NeRFs using just single-view images, text prompts, and explicit target lighting. The advanced features of FaceDNeRF have been designed to produce more impressive results than existing 2D editing approaches that rely on 2D segmentation maps for editable attributes. Experiments show that our FaceDNeRF achieves exceptionally realistic results and unprecedented flexibility in editing compared with state-of-the-art 3D face reconstruction and editing methods. Our code will be available at https://github.com/BillyXYB/FaceDNeRF.

arxiv情報

著者 Hao Zhang,Yanbo Xu,Tianyuan Dai,Yu-Wing Tai,Chi-Keung Tang
発行日 2023-12-04 16:25:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク