UP-SLAM: Adaptively Structured Gaussian SLAM with Uncertainty Prediction in Dynamic Environments

要約

視覚的な同時ローカリゼーションとマッピング(SLAM)のための最近の3Dガウススプラッティング(3DGS)技術は、追跡と高忠実度マッピングで大幅に進歩しています。
ただし、それらの連続的な最適化フレームワークと動的オブジェクトに対する感度は、実際のシナリオでのリアルタイムのパフォーマンスと堅牢性を制限します。
並列化されたフレームワークの追跡とマッピングを切り離す動的環境のためのリアルタイムRGB-DスラムシステムであるUpSlamを提示します。
確率的なオクトリーが採用され、ガウスプリミティブを適応的に管理し、手作りのしきい値なしで効率的な初期化と剪定を可能にします。
追跡中に動的領域を堅牢にフィルタリングするために、マルチモーダル残差を融合してピクセルあたりのモーションの不確実性を推定し、セマンティックラベルに依存せずにオープンセットの動的オブジェクト処理を達成するトレーニングフリーの不確実性推定器を提案します。
さらに、一時的なエンコーダーは、レンダリング品質を向上させるように設計されています。
同時に、低次元の特徴は、浅い多層パーセプトロンを介して効率的に変換され、ディノの特徴を構築します。ディノの特徴は、ガウスフィールドを濃縮し、不確実性予測の堅牢性を向上させるために使用されます。
複数の挑戦的なデータセットでの広範な実験は、アップスラムがローカリゼーションの精度(59.8%)とレンダリング品質(4.57 dB PSNR)の両方で最先端の方法を上回ることを示唆しています。
https://aczheng-cai.github.io/up_slam.github.io/

要約(オリジナル)

Recent 3D Gaussian Splatting (3DGS) techniques for Visual Simultaneous Localization and Mapping (SLAM) have significantly progressed in tracking and high-fidelity mapping. However, their sequential optimization framework and sensitivity to dynamic objects limit real-time performance and robustness in real-world scenarios. We present UP-SLAM, a real-time RGB-D SLAM system for dynamic environments that decouples tracking and mapping through a parallelized framework. A probabilistic octree is employed to manage Gaussian primitives adaptively, enabling efficient initialization and pruning without hand-crafted thresholds. To robustly filter dynamic regions during tracking, we propose a training-free uncertainty estimator that fuses multi-modal residuals to estimate per-pixel motion uncertainty, achieving open-set dynamic object handling without reliance on semantic labels. Furthermore, a temporal encoder is designed to enhance rendering quality. Concurrently, low-dimensional features are efficiently transformed via a shallow multilayer perceptron to construct DINO features, which are then employed to enrich the Gaussian field and improve the robustness of uncertainty prediction. Extensive experiments on multiple challenging datasets suggest that UP-SLAM outperforms state-of-the-art methods in both localization accuracy (by 59.8%) and rendering quality (by 4.57 dB PSNR), while maintaining real-time performance and producing reusable, artifact-free static maps in dynamic environments.The project: https://aczheng-cai.github.io/up_slam.github.io/

arxiv情報

著者 Wancai Zheng,Linlin Ou,Jiajie He,Libo Zhou,Xinyi Yu,Yan Wei
発行日 2025-05-28 13:23:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク