HS-SLAM: Hybrid Representation with Structural Supervision for Improved Dense SLAM

要約

NERFベースのSLAMは最近、追跡と再建において有望な結果を達成しました。
ただし、既存の方法は、十分なシーンの表現を提供し、構造情報をキャプチャし、重要な動きや忘れられているシーンのグローバルな一貫性を維持する際の課題に直面しています。
この目的のために、私たちはこれらの問題に取り組むためにHS-SLALを提示します。
シーンの表現容量を強化するために、ハッシュグリッド、Tri-Planes、および1-ブロブの相補的な強度を組み合わせたハイブリッドエンコードネットワークを提案し、再構成の完全性と滑らかさを改善します。
さらに、シーン構造をよりよくキャプチャするために、個々の光線ではなく非ローカルピクセルのパッチをサンプリングすることにより、構造監督を導入します。
グローバルな一貫性を確保するために、アクティブなグローバルバンドル調整(BA)を実装して、カメラのドリフトを排除し、累積エラーを軽減します。
実験結果は、HS-SLAMがロボット工学に必要な効率を維持しながら、追跡と再構成の精度のベースラインよりも優れていることを示しています。

要約(オリジナル)

NeRF-based SLAM has recently achieved promising results in tracking and reconstruction. However, existing methods face challenges in providing sufficient scene representation, capturing structural information, and maintaining global consistency in scenes emerging significant movement or being forgotten. To this end, we present HS-SLAM to tackle these problems. To enhance scene representation capacity, we propose a hybrid encoding network that combines the complementary strengths of hash-grid, tri-planes, and one-blob, improving the completeness and smoothness of reconstruction. Additionally, we introduce structural supervision by sampling patches of non-local pixels rather than individual rays to better capture the scene structure. To ensure global consistency, we implement an active global bundle adjustment (BA) to eliminate camera drifts and mitigate accumulative errors. Experimental results demonstrate that HS-SLAM outperforms the baselines in tracking and reconstruction accuracy while maintaining the efficiency required for robotics.

arxiv情報

著者 Ziren Gong,Fabio Tosi,Youmin Zhang,Stefano Mattoccia,Matteo Poggi
発行日 2025-03-27 17:59:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク