SLAIM: Robust Dense Neural SLAM for Online Tracking and Mapping

要約

SLAIM – 同時ローカリゼーションと暗黙的マッピングを紹介します。
最先端の追跡パフォーマンスを実現するために、Neural Radiance Field SLAM (NeRF-SLAM) に合わせた新しい粗密追跡モデルを提案します。
特に、既存の NeRF-SLAM システムは、従来の SLAM アルゴリズムと比較して追跡パフォーマンスが一貫して劣っています。
NeRF-SLAM メソッドは、画像の位置合わせと測光バンドル調整を介してカメラの追跡を解決します。
このような最適化プロセスは、画像空間における最適化損失の引力範囲が狭いこと (極小値) と初期対応の欠如のため、最適化することが困難です。
NeRF の上にガウス ピラミッド フィルターを実装することでこれらの制限を軽減し、粗いものから細かいものまでの追跡最適化戦略を促進します。
さらに、NeRF システムは、限られた入力ビューで適切なジオメトリに収束する際に課題に直面します。
従来のアプローチでは符号付き距離関数 (SDF) ベースの NeRF を使用し、深度測定を通じてグラウンド トゥルース SDF を近似することで SDF 値を直接監視していましたが、これによりジオメトリが最適化されていないことがよくありました。
対照的に、私たちの方法は体積密度表現を採用し、光線終端分布に新しい KL 正則化子を導入し、シーンのジオメトリが空の空間と不透明な表面で構成されるように制限します。
当社のソリューションは、ローカルとグローバルの両方のバンドル調整を実装して、堅牢な (粗いから細かいまで) 正確な (KL 正則化) SLAM ソリューションを生成します。
私たちは複数のデータセット (ScanNet、TUM、レプリカ) で実験を実施し、追跡と再構成精度における最先端の結果を示しています。

要約(オリジナル)

We present SLAIM – Simultaneous Localization and Implicit Mapping. We propose a novel coarse-to-fine tracking model tailored for Neural Radiance Field SLAM (NeRF-SLAM) to achieve state-of-the-art tracking performance. Notably, existing NeRF-SLAM systems consistently exhibit inferior tracking performance compared to traditional SLAM algorithms. NeRF-SLAM methods solve camera tracking via image alignment and photometric bundle-adjustment. Such optimization processes are difficult to optimize due to the narrow basin of attraction of the optimization loss in image space (local minima) and the lack of initial correspondences. We mitigate these limitations by implementing a Gaussian pyramid filter on top of NeRF, facilitating a coarse-to-fine tracking optimization strategy. Furthermore, NeRF systems encounter challenges in converging to the right geometry with limited input views. While prior approaches use a Signed-Distance Function (SDF)-based NeRF and directly supervise SDF values by approximating ground truth SDF through depth measurements, this often results in suboptimal geometry. In contrast, our method employs a volume density representation and introduces a novel KL regularizer on the ray termination distribution, constraining scene geometry to consist of empty space and opaque surfaces. Our solution implements both local and global bundle-adjustment to produce a robust (coarse-to-fine) and accurate (KL regularizer) SLAM solution. We conduct experiments on multiple datasets (ScanNet, TUM, Replica) showing state-of-the-art results in tracking and in reconstruction accuracy.

arxiv情報

著者 Vincent Cartillier,Grant Schindler,Irfan Essa
発行日 2024-04-17 14:23:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク