ScanNet++: A High-Fidelity Dataset of 3D Indoor Scenes

要約

屋内シーンの高品質かつ商品レベルのジオメトリと色のキャプチャを組み合わせた大規模なデータセットである ScanNet++ を紹介します。
各シーンは、DSLR カメラからの登録された 3,300 万ピクセルの画像と、iPhone からの RGB-D ストリームとともに、サブミリメートルの解像度でハイエンドのレーザー スキャナーでキャプチャされます。
シーンの再構築には、意味論のオープンボキャブラリーでさらに注釈が付けられ、ラベルがあいまいなシナリオには、包括的な意味論の理解のために明示的に注釈が付けられます。
ScanNet++ は、多様で曖昧なセマンティック ラベリング シナリオを包括的にカプセル化する 3D セマンティック シーン理解のための新しいベンチマークに加えて、高品質の RGB キャプチャと重要なことに商品レベルの画像の両方から、新しいビュー合成のための新しい現実世界のベンチマークを可能にします。

現在、ScanNet++ には 460 のシーン、キャプチャされた 280,000 の DSLR 画像、および 370 万を超える iPhone RGBD フレームが含まれています。

要約(オリジナル)

We present ScanNet++, a large-scale dataset that couples together capture of high-quality and commodity-level geometry and color of indoor scenes. Each scene is captured with a high-end laser scanner at sub-millimeter resolution, along with registered 33-megapixel images from a DSLR camera, and RGB-D streams from an iPhone. Scene reconstructions are further annotated with an open vocabulary of semantics, with label-ambiguous scenarios explicitly annotated for comprehensive semantic understanding. ScanNet++ enables a new real-world benchmark for novel view synthesis, both from high-quality RGB capture, and importantly also from commodity-level images, in addition to a new benchmark for 3D semantic scene understanding that comprehensively encapsulates diverse and ambiguous semantic labeling scenarios. Currently, ScanNet++ contains 460 scenes, 280,000 captured DSLR images, and over 3.7M iPhone RGBD frames.

arxiv情報

著者 Chandan Yeshwanth,Yueh-Cheng Liu,Matthias Nießner,Angela Dai
発行日 2023-08-22 13:02:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク