要約
RGB のみの高密度同時位置特定とマッピング (SLAM) の最近の進歩では、主にグリッドベースのニューラル暗黙的エンコーディングが利用されており、グローバル マップとポーズの一貫性を効率的に実現するのに苦労しています。
この目的を達成するために、コストのかかるバックプロパゲーションを必要とせずに、キーフレームのポーズと深度の更新に適応する柔軟なニューラル点群シーン表現を使用した、効率的な RGB のみの高密度 SLAM システムを提案します。
RGB のみの SLAM のもう 1 つの重大な課題は、幾何学的事前分布が欠如していることです。
この問題を軽減するために、単眼深度推定器を利用して、単眼深度のスケールとともにキーフレームのポーズと深度を最適化するバンドル調整用の新しい DSPO レイヤーを導入します。
最後に、私たちのシステムはループ クロージャとオンライン グローバル バンドル調整の恩恵を受け、レプリカ、TUM-RGBD、および ScanNet データセットでの追跡、マッピング、レンダリングの精度において、既存の高密度ニューラル RGB SLAM メソッドよりも優れているか、競合するパフォーマンスを発揮します。
ソースコードは公開される予定です。
要約(オリジナル)
Recent advancements in RGB-only dense Simultaneous Localization and Mapping (SLAM) have predominantly utilized grid-based neural implicit encodings and/or struggle to efficiently realize global map and pose consistency. To this end, we propose an efficient RGB-only dense SLAM system using a flexible neural point cloud scene representation that adapts to keyframe poses and depth updates, without needing costly backpropagation. Another critical challenge of RGB-only SLAM is the lack of geometric priors. To alleviate this issue, with the aid of a monocular depth estimator, we introduce a novel DSPO layer for bundle adjustment which optimizes the pose and depth of keyframes along with the scale of the monocular depth. Finally, our system benefits from loop closure and online global bundle adjustment and performs either better or competitive to existing dense neural RGB SLAM methods in tracking, mapping and rendering accuracy on the Replica, TUM-RGBD and ScanNet datasets. The source code will be made available.
arxiv情報
| 著者 | Ganlin Zhang,Erik Sandström,Youmin Zhang,Manthan Patel,Luc Van Gool,Martin R. Oswald | 
| 発行日 | 2024-03-30 00:24:44+00:00 | 
| arxivサイト | arxiv_id(pdf) | 
提供元, 利用サービス
arxiv.jp, Google
