要約
【タイトル】
Signed Distance Fieldsに基づく深く密なSLAMシステムの効率的な実現
【要約】
・ESLAMは、同時位置推定と地図作成(SLAM)のための効率的な暗黙的ニューラル表現手法を提供する。
・ESLAMは、RGB-Dフレームを読み込み、直列のカメラ位置を推定しながら、徐々にシーン表現を再構築する。
・Newral Radiance Fields(NeRF)の最新の進歩をSLAMシステムに組み込んでいるため、効率的かつ正確な密集視覚SLAM方法が実現される。
・シーン表現は、複数のスケールの軸に沿った直交特徴面と浅いデコーダから構成され、連続する空間の各点に対して、補間された特徴を Truncated Signed Distance Field (TSDF) および RGB 値にデコードする。
・標準データセットの Replica、ScanNet、および TUM RGB-D 上の広範な実験により、ESLAMは、最新の密集視覚SLAM方法の3D再構築およびカメラ位置の推定の精度を50%以上向上させ、最大10倍高速化され、事前トレーニングは必要ないことが示されています。
要約(オリジナル)
We present ESLAM, an efficient implicit neural representation method for Simultaneous Localization and Mapping (SLAM). ESLAM reads RGB-D frames with unknown camera poses in a sequential manner and incrementally reconstructs the scene representation while estimating the current camera position in the scene. We incorporate the latest advances in Neural Radiance Fields (NeRF) into a SLAM system, resulting in an efficient and accurate dense visual SLAM method. Our scene representation consists of multi-scale axis-aligned perpendicular feature planes and shallow decoders that, for each point in the continuous space, decode the interpolated features into Truncated Signed Distance Field (TSDF) and RGB values. Our extensive experiments on three standard datasets, Replica, ScanNet, and TUM RGB-D show that ESLAM improves the accuracy of 3D reconstruction and camera localization of state-of-the-art dense visual SLAM methods by more than 50%, while it runs up to 10 times faster and does not require any pre-training.
arxiv情報
| 著者 | Mohammad Mahdi Johari,Camilla Carta,François Fleuret |
| 発行日 | 2023-04-03 08:54:42+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI