H-SLAM: Hybrid Direct-Indirect Visual SLAM

要約

単眼オドメトリにおけるハイブリッド方式の最近の成功により、ハイブリッド単眼 SLAM の性能向上を一般化する多くの試みが行われています。
しかし、ほとんどの試みはいくつかの点で不十分であり、最も顕著な問題は 2 つの異なるマップ表現 (ローカル マップとグローバル マップ) が必要であり、それぞれに異なる、計算コストが高く、維持するために冗長なプロセスが必要になることです。
さらに、これらのマップは相互にドリフトする傾向があり、その結果、ポーズとシーンの推定値が矛盾し、致命的な失敗につながります。
この論文では、記述子の共有を利用して単一の逆深度シーン表現を生成する新しいアプローチを提案します。
この表現はローカルで使用でき、グローバルにクエリしてループ クロージャを実行できます。また、冗長なポイントがローカル マップから周辺化された後に以前に観察されたマップ ポイントを再アクティブ化する機能を備えているため、個別の冗長なマップ メンテナンス プロセスが不要になります。
私たちの方法で生成されたマップは相互にドリフトを示さず、他の単眼 SLAM システムに必要な計算コストとメモリ使用量の数分の 1 で計算できます。
リソース要件が削減されているにもかかわらず、提案されたアプローチは堅牢性と精度を維持し、EuRoC などのよく知られたデータセットからのシーケンスの大部分で最先端の SLAM 手法 (LDSO、ORB-SLAM3 など) に匹敵するパフォーマンスを提供します。
キティ、トゥム VI。
ソース コードは https://github.com/AUBVRL/fslam_ros_docker から入手できます。

要約(オリジナル)

The recent success of hybrid methods in monocular odometry has led to many attempts to generalize the performance gains to hybrid monocular SLAM. However, most attempts fall short in several respects, with the most prominent issue being the need for two different map representations (local and global maps), with each requiring different, computationally expensive, and often redundant processes to maintain. Moreover, these maps tend to drift with respect to each other, resulting in contradicting pose and scene estimates, and leading to catastrophic failure. In this paper, we propose a novel approach that makes use of descriptor sharing to generate a single inverse depth scene representation. This representation can be used locally, queried globally to perform loop closure, and has the ability to re-activate previously observed map points after redundant points are marginalized from the local map, eliminating the need for separate and redundant map maintenance processes. The maps generated by our method exhibit no drift between each other, and can be computed at a fraction of the computational cost and memory footprint required by other monocular SLAM systems. Despite the reduced resource requirements, the proposed approach maintains its robustness and accuracy, delivering performance comparable to state-of-the-art SLAM methods (e.g., LDSO, ORB-SLAM3) on the majority of sequences from well-known datasets like EuRoC, KITTI, and TUM VI. The source code is available at: https://github.com/AUBVRL/fslam_ros_docker.

arxiv情報

著者 Georges Younes,Douaa Khalil,John Zelek,Daniel Asmar
発行日 2023-06-12 18:39:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク