SplaTAM: Splat, Track & Map 3D Gaussians for Dense RGB-D SLAM

要約

高密度同時ローカライゼーションおよびマッピング (SLAM) は、ロボット工学および拡張現実アプリケーションにとって重要です。
ただし、現在の方法は、シーンを非ボリュームまたは暗黙的に表現する方法によって妨げられることがよくあります。
この研究では、SplaTAM を導入します。これは、明示的な体積表現、つまり 3D ガウスを初めて利用して、単一の未ポーズの RGB-D カメラからの高忠実度の再構成を可能にし、既存の手法の能力を超えるアプローチです。
SplaTAM は、基礎となるガウス表現に合わせて調整されたシンプルなオンライン追跡およびマッピング システムを採用しています。
シルエット マスクを利用して、シーンの密度の存在をエレガントに捉えます。
この組み合わせにより、高速レンダリングと高密度の最適化、領域が以前にマッピングされているかどうかの迅速な判断、ガウス分布を追加することによる構造化マップの拡張など、以前の表現に比べていくつかの利点が得られます。
広範な実験により、SplaTAM はカメラ姿勢推定、マップ構築、および新規ビュー合成において既存の方法と比較して最大 2 倍優れたパフォーマンスを達成し、より没入型の高忠実度 SLAM アプリケーションへの道を開くことが示されています。

要約(オリジナル)

Dense simultaneous localization and mapping (SLAM) is crucial for robotics and augmented reality applications. However, current methods are often hampered by the non-volumetric or implicit way they represent a scene. This work introduces SplaTAM, an approach that, for the first time, leverages explicit volumetric representations, i.e., 3D Gaussians, to enable high-fidelity reconstruction from a single unposed RGB-D camera, surpassing the capabilities of existing methods. SplaTAM employs a simple online tracking and mapping system tailored to the underlying Gaussian representation. It utilizes a silhouette mask to elegantly capture the presence of scene density. This combination enables several benefits over prior representations, including fast rendering and dense optimization, quickly determining if areas have been previously mapped, and structured map expansion by adding more Gaussians. Extensive experiments show that SplaTAM achieves up to 2x superior performance in camera pose estimation, map construction, and novel-view synthesis over existing methods, paving the way for more immersive high-fidelity SLAM applications.

arxiv情報

著者 Nikhil Keetha,Jay Karhade,Krishna Murthy Jatavallabhula,Gengshan Yang,Sebastian Scherer,Deva Ramanan,Jonathon Luiten
発行日 2024-04-16 15:50:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.RO パーマリンク