要約
(視覚)同時ローカリゼーションとマッピング(SLAM)は、自律システムが大規模な環境をナビゲートして理解できるようにする上での根本的な課題のままです。
従来のSLAMアプローチは、特にシーンの再構築とバンドル調整(BA)に広範な計算リソースが必要な大規模な設定で、効率と精度のバランスをとるのに苦労しています。
ただし、視覚的ランドマークのまばらなポイントクラウドの形式でのこのシーンの再構築は、ナビゲーションと計画方法に異なるマップ表現が必要であるため、スラムシステム内でのみ使用されることがよくあります。
したがって、この作業では、主に2ビューループクロージャーのアプローチに基づいて、再構成なしに、よりスケーラブルな視覚スラム(VSLAM)アプローチを調査します。
密度の高いジオメトリ表現のないまばらなキーフレームポーズグラフにマップを制限することにより、当社の「2GO」システムは、競争力のある絶対軌道精度で効率的な最適化を実現します。
特に、画像マッチングと単眼の深さの前の最近の進歩により、2ビューエッジからの非常に正確な軌跡の最適化が可能になることがわかります。
大規模なシナリオを含む多様なデータセットで広範な実験を実施し、ランタイム、精度、マップサイズのトレードオフの詳細な分析を提供します。
私たちの結果は、この合理化されたアプローチがリアルタイムのパフォーマンスをサポートし、マップサイズと軌道の持続時間を十分に拡大し、大規模な環境への長期にわたる展開のためにVSLAMの機能を効果的に広げることを示しています。
要約(オリジナル)
(Visual) Simultaneous Localization and Mapping (SLAM) remains a fundamental challenge in enabling autonomous systems to navigate and understand large-scale environments. Traditional SLAM approaches struggle to balance efficiency and accuracy, particularly in large-scale settings where extensive computational resources are required for scene reconstruction and Bundle Adjustment (BA). However, this scene reconstruction, in the form of sparse pointclouds of visual landmarks, is often only used within the SLAM system because navigation and planning methods require different map representations. In this work, we therefore investigate a more scalable Visual SLAM (VSLAM) approach without reconstruction, mainly based on approaches for two-view loop closures. By restricting the map to a sparse keyframed pose graph without dense geometry representations, our ‘2GO’ system achieves efficient optimization with competitive absolute trajectory accuracy. In particular, we find that recent advancements in image matching and monocular depth priors enable very accurate trajectory optimization from two-view edges. We conduct extensive experiments on diverse datasets, including large-scale scenarios, and provide a detailed analysis of the trade-offs between runtime, accuracy, and map size. Our results demonstrate that this streamlined approach supports real-time performance, scales well in map size and trajectory duration, and effectively broadens the capabilities of VSLAM for long-duration deployments to large environments.
arxiv情報
著者 | Tian Yi Lim,Boyang Sun,Marc Pollefeys,Hermann Blum |
発行日 | 2025-03-20 16:05:35+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google