要約
現実的な人間中心のレンダリングは、コンピュータ ビジョンとコンピュータ グラフィックスの両方で重要な役割を果たします。
ここ数年でアルゴリズムの面では急速な進歩が見られましたが、既存の人間中心のレンダリング データセットとベンチマークは、レンダリング効果に重要な多様性の点でかなり貧弱です。
研究者は通常、現在のデータセットで少数のレンダリング問題を調査して評価する必要に迫られていますが、実際のアプリケーションでは、さまざまなシナリオにわたって堅牢な手法が必要です。
この研究では、ニューラル アクター レンダリングのための人間のパフォーマンス データの大規模で忠実度の高いリポジトリである DNA レンダリングを紹介します。
DNA レンダリングには、いくつかの魅力的な属性があります。
まず、私たちのデータセットには 1,500 人以上の人物、5,000 個のモーション シーケンス、および 6,750 万フレームのデータ量が含まれています。
次に、2D/3D の人体キーポイント、前景マスク、SMPLX モデル、布地/アクセサリー マテリアル、マルチビュー画像、ビデオなど、各主題に豊富なアセットを提供します。
これらのアセットにより、下流のレンダリング タスクにおける現在のメソッドの精度が向上します。
3 番目に、データをキャプチャするためのプロフェッショナルなマルチビュー システムを構築します。これには、最大 4096 x 3000 の解像度、15 fps の速度、および船尾カメラのキャリブレーション ステップを備えた 60 台の同期カメラが含まれており、タスクのトレーニングと評価のための高品質のリソースが確保されています。
データセットとともに、新しいビュー合成、新しいポーズ アニメーション合成、新しいアイデンティティ レンダリング方法の既存の進捗状況を評価するための複数のタスクを備えた、本格的な大規模かつ定量的なベンチマークを提供します。
この原稿では、人間中心のレンダリングに対する新たな観察、課題、将来の方向性を明らかにするものとして、DNA レンダリングの取り組みについて説明します。
データセット、コード、ベンチマークは https://dna-rendering.github.io/ で公開されます。
要約(オリジナル)
Realistic human-centric rendering plays a key role in both computer vision and computer graphics. Rapid progress has been made in the algorithm aspect over the years, yet existing human-centric rendering datasets and benchmarks are rather impoverished in terms of diversity, which are crucial for rendering effect. Researchers are usually constrained to explore and evaluate a small set of rendering problems on current datasets, while real-world applications require methods to be robust across different scenarios. In this work, we present DNA-Rendering, a large-scale, high-fidelity repository of human performance data for neural actor rendering. DNA-Rendering presents several alluring attributes. First, our dataset contains over 1500 human subjects, 5000 motion sequences, and 67.5M frames’ data volume. Second, we provide rich assets for each subject — 2D/3D human body keypoints, foreground masks, SMPLX models, cloth/accessory materials, multi-view images, and videos. These assets boost the current method’s accuracy on downstream rendering tasks. Third, we construct a professional multi-view system to capture data, which contains 60 synchronous cameras with max 4096 x 3000 resolution, 15 fps speed, and stern camera calibration steps, ensuring high-quality resources for task training and evaluation. Along with the dataset, we provide a large-scale and quantitative benchmark in full-scale, with multiple tasks to evaluate the existing progress of novel view synthesis, novel pose animation synthesis, and novel identity rendering methods. In this manuscript, we describe our DNA-Rendering effort as a revealing of new observations, challenges, and future directions to human-centric rendering. The dataset, code, and benchmarks will be publicly available at https://dna-rendering.github.io/
arxiv情報
著者 | Wei Cheng,Ruixiang Chen,Wanqi Yin,Siming Fan,Keyu Chen,Honglin He,Huiwen Luo,Zhongang Cai,Jingbo Wang,Yang Gao,Zhengming Yu,Zhengyu Lin,Daxuan Ren,Lei Yang,Ziwei Liu,Chen Change Loy,Chen Qian,Wayne Wu,Dahua Lin,Bo Dai,Kwan-Yee Lin |
発行日 | 2023-07-19 17:58:03+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google