Drift-free Visual SLAM using Digital Twins

要約

都市環境における世界的に一貫した位置特定は、自動運転車やドローンなどの自律システムや、視覚障害者向けの支援技術にとって極めて重要です。
従来の Visual-Inertial Odometry (VIO) および Visual Simultaneous Localization and Mapping (VSLAM) 手法は、ローカル姿勢推定には適していますが、ローカル センサー データに依存するため、長期的にはドリフトに悩まされます。
GPS はこのドリフトを防止しますが、屋内では利用できず、都市部では信頼できないことがよくあります。
別の方法は、視覚特徴マッチングを使用してカメラを既存の 3D マップに位置特定することです。
これにより、センチメートルレベルの正確な位置特定が可能になりますが、現在のビューと地図の視覚的な類似性によって制限されます。
この論文では、VIO/VSLAM システムによって生成されたまばらな 3D 点群を点対平面マッチングを使用してデジタル ツインに位置合わせすることにより、正確でグローバルに一貫した位置特定を実現する新しいアプローチを紹介します。
視覚的なデータの関連付けは必要ありません。
提案された方法は、VIO/VSLAM システムに緊密に統合された 6-DoF グローバル測定を提供します。
高忠実度の GPS シミュレータとドローンから収集された実世界のデータで実行される実験は、当社のアプローチが最先端の VIO-GPS システムを上回り、最先端のシステムと比較して視点の変更に対する優れた堅牢性を提供することを実証しています。
アートビジュアルSLAMシステム。

要約(オリジナル)

Globally-consistent localization in urban environments is crucial for autonomous systems such as self-driving vehicles and drones, as well as assistive technologies for visually impaired people. Traditional Visual-Inertial Odometry (VIO) and Visual Simultaneous Localization and Mapping (VSLAM) methods, though adequate for local pose estimation, suffer from drift in the long term due to reliance on local sensor data. While GPS counteracts this drift, it is unavailable indoors and often unreliable in urban areas. An alternative is to localize the camera to an existing 3D map using visual-feature matching. This can provide centimeter-level accurate localization but is limited by the visual similarities between the current view and the map. This paper introduces a novel approach that achieves accurate and globally-consistent localization by aligning the sparse 3D point cloud generated by the VIO/VSLAM system to a digital twin using point-to-plane matching; no visual data association is needed. The proposed method provides a 6-DoF global measurement tightly integrated into the VIO/VSLAM system. Experiments run on a high-fidelity GPS simulator and real-world data collected from a drone demonstrate that our approach outperforms state-of-the-art VIO-GPS systems and offers superior robustness against viewpoint changes compared to the state-of-the-art Visual SLAM systems.

arxiv情報

著者 Roxane Merat,Giovanni Cioffi,Leonard Bauersfeld,Davide Scaramuzza
発行日 2024-12-12 10:07:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク