NICER-SLAM: Neural Implicit Scene Encoding for RGB SLAM

要約

神経暗黙表現は、最近、同時定位マッピング(SLAM)、特に高密度視覚SLAMで人気を集めている。しかし、この方向での先行研究は、RGB-Dセンサに依存するか、カメラ追跡のために別の単眼SLAMアプローチを必要とし、高忠実度の高密度3Dシーン再構成を生成しない。本論文では、カメラポーズと階層的なニューラル陰影地図表現を同時に最適化し、高品質な新規ビュー合成も可能な高密度RGB SLAMシステム、NICER-SLAMを紹介する。マッピングの最適化プロセスを容易にするために、入手しやすい単眼幾何学的手がかりやオプティカルフローを含む追加の監視信号を統合し、さらにジオメトリの一貫性を強化するために単純なワープ損失を導入している。さらに、複雑な室内シーンでの性能をさらに高めるために、ボリュームレンダリング方程式において、符号付き距離関数(SDF)から密度への局所適応変換も提案する。合成データおよび実世界データの両方において、我々は高密度マッピング、トラッキング、および新しいビュー合成において、最近のRGB-D SLAMシステムに勝るとも劣らない性能を実証している。

要約(オリジナル)

Neural implicit representations have recently become popular in simultaneous localization and mapping (SLAM), especially in dense visual SLAM. However, previous works in this direction either rely on RGB-D sensors, or require a separate monocular SLAM approach for camera tracking and do not produce high-fidelity dense 3D scene reconstruction. In this paper, we present NICER-SLAM, a dense RGB SLAM system that simultaneously optimizes for camera poses and a hierarchical neural implicit map representation, which also allows for high-quality novel view synthesis. To facilitate the optimization process for mapping, we integrate additional supervision signals including easy-to-obtain monocular geometric cues and optical flow, and also introduce a simple warping loss to further enforce geometry consistency. Moreover, to further boost performance in complicated indoor scenes, we also propose a local adaptive transformation from signed distance functions (SDFs) to density in the volume rendering equation. On both synthetic and real-world datasets we demonstrate strong performance in dense mapping, tracking, and novel view synthesis, even competitive with recent RGB-D SLAM systems.

arxiv情報

著者 Zihan Zhu,Songyou Peng,Viktor Larsson,Zhaopeng Cui,Martin R. Oswald,Andreas Geiger,Marc Pollefeys
発行日 2023-02-07 17:06:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク