SLAM (simultaneous localization and mapping)およびその関連問題に対して、様々なデータセットが提案されている。しかし、既存のデータセットには、小さな環境、不完全なグランドトゥルース、深度や赤外線画像などの重要なセンサデータが含まれていないことが多い。我々は、民生用深度カメラを用いて、建物スケールの3D再構成を取得するための使いやすいフレームワークを提案する。複雑で高価な撮影セットアップとは異なり、我々のシステムはクラウドソーシングを可能にし、データを大量に必要とするアルゴリズムに大きな利益をもたらすことができる。類似のシステムと比較して、我々は生の深度マップをオドメトリ計算とループクロージャの洗練に利用し、より良い再構成を実現する。我々は、建物規模の3Dデータセット(BS3D)を取得し、改良された単眼深度推定モデルを訓練することによって、その価値を実証する。また、カラー画像とアクティブ赤外画像の両方を用いて、視覚-慣性オドメトリ法のベンチマークを行うというユニークな実験も行っている。
Various datasets have been proposed for simultaneous localization and mapping (SLAM) and related problems. Existing datasets often include small environments, have incomplete ground truth, or lack important sensor data, such as depth and infrared images. We propose an easy-to-use framework for acquiring building-scale 3D reconstruction using a consumer depth camera. Unlike complex and expensive acquisition setups, our system enables crowd-sourcing, which can greatly benefit data-hungry algorithms. Compared to similar systems, we utilize raw depth maps for odometry computation and loop closure refinement which results in better reconstructions. We acquire a building-scale 3D dataset (BS3D) and demonstrate its value by training an improved monocular depth estimation model. As a unique experiment, we benchmark visual-inertial odometry methods using both color and active infrared images.
著者 | Janne Mustaniemi,Juho Kannala,Esa Rahtu,Li Liu,Janne Heikkilä |
発行日 | 2023-01-03 11:46:14+00:00 |
arxivサイト | arxiv_id(pdf) |