GO-SLAM: Global Optimization for Consistent 3D Instant Reconstruction

要約

ニューラル暗黙的表現は、最近、高密度同時位置特定およびマッピング (SLAM) に関して説得力のある結果を実証しましたが、カメラ追跡におけるエラーの蓄積と再構成における歪みに悩まされています。
意図的に、ポーズと 3D 再構成をリアルタイムでグローバルに最適化する深層学習ベースの高密度ビジュアル SLAM フレームワークである GO-SLAM を紹介します。
堅牢な姿勢推定がその核心であり、効率的なループ クロージングとオンラインのフル バンドル調整によってサポートされており、入力フレームの完全な履歴の学習されたグローバル ジオメトリを利用してフレームごとに最適化されます。
同時に、暗黙的かつ連続的なサーフェス表現をオンザフライで更新して、3D 再構築のグローバルな一貫性を確保します。
さまざまな合成データセットと現実世界のデータセットの結果は、GO-SLAM が追跡の堅牢性と再構成精度において最先端のアプローチを上回ることを示しています。
さらに、GO-SLAM は多用途で、単眼、ステレオ、RGB-D 入力で実行できます。

要約(オリジナル)

Neural implicit representations have recently demonstrated compelling results on dense Simultaneous Localization And Mapping (SLAM) but suffer from the accumulation of errors in camera tracking and distortion in the reconstruction. Purposely, we present GO-SLAM, a deep-learning-based dense visual SLAM framework globally optimizing poses and 3D reconstruction in real-time. Robust pose estimation is at its core, supported by efficient loop closing and online full bundle adjustment, which optimize per frame by utilizing the learned global geometry of the complete history of input frames. Simultaneously, we update the implicit and continuous surface representation on-the-fly to ensure global consistency of 3D reconstruction. Results on various synthetic and real-world datasets demonstrate that GO-SLAM outperforms state-of-the-art approaches at tracking robustness and reconstruction accuracy. Furthermore, GO-SLAM is versatile and can run with monocular, stereo, and RGB-D input.

arxiv情報

著者 Youmin Zhang,Fabio Tosi,Stefano Mattoccia,Matteo Poggi
発行日 2023-09-05 17:59:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク