HI-SLAM2: Geometry-Aware Gaussian SLAM for Fast Monocular Scene Reconstruction

要約

RGB入力のみを使用して、高速かつ正確な単眼シーンの再構成を実現する幾何学的なガウススラムシステムであるHi-Slam2を提示します。
既存のニューラルSLAMまたは3DGSベースのSLAMメソッドは、品質のレンダリングと幾何学の精度の間でトレードオフすることがよくあります。私たちの研究は、両方がRGB入力のみと同時に達成できることを実証しています。
私たちのアプローチの重要なアイデアは、習慣の簡単な単眼のプリエアと学習ベースの密なスラムを組み合わせて、コアマップ表現として3Dガウスのスプラッティングを使用してシーンを効率的にモデル化することにより、幾何学推定の能力を高めることです。
ループの閉鎖時に、当社のメソッドは、固定されたキーフレームの更新に基づいて3Dガウスユニットを明示的に変形させることにより、効率的なポーズグラフバンドル調整とインスタントマップの更新により、オンザフライのグローバルな一貫性を保証します。
さらに、グリッドベースのスケールアライメント戦略を導入して、深さの詳細のために、以前の深さでのスケールの一貫性を改善します。
レプリカ、スキャネ、およびscannet ++での広範な実験を通じて、既存の神経スラム法に対する大幅な改善を示し、再構築とレンダリング品質の両方でRGB-Dベースの方法を上回ります。
プロジェクトページとソースコードは、https://hi-slam2.github.io/で利用可能になります。

要約(オリジナル)

We present HI-SLAM2, a geometry-aware Gaussian SLAM system that achieves fast and accurate monocular scene reconstruction using only RGB input. Existing Neural SLAM or 3DGS-based SLAM methods often trade off between rendering quality and geometry accuracy, our research demonstrates that both can be achieved simultaneously with RGB input alone. The key idea of our approach is to enhance the ability for geometry estimation by combining easy-to-obtain monocular priors with learning-based dense SLAM, and then using 3D Gaussian splatting as our core map representation to efficiently model the scene. Upon loop closure, our method ensures on-the-fly global consistency through efficient pose graph bundle adjustment and instant map updates by explicitly deforming the 3D Gaussian units based on anchored keyframe updates. Furthermore, we introduce a grid-based scale alignment strategy to maintain improved scale consistency in prior depths for finer depth details. Through extensive experiments on Replica, ScanNet, and ScanNet++, we demonstrate significant improvements over existing Neural SLAM methods and even surpass RGB-D-based methods in both reconstruction and rendering quality. The project page and source code will be made available at https://hi-slam2.github.io/.

arxiv情報

著者 Wei Zhang,Qing Cheng,David Skuddis,Niclas Zeller,Daniel Cremers,Norbert Haala
発行日 2025-04-29 12:03:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク