DK-SLAM: Monocular Visual SLAM with Deep Keypoints Adaptive Learning, Tracking and Loop-Closing

要約

手作りされた特徴における信頼性の低い特徴抽出とマッチングは、複雑な現実世界のシナリオにおけるビジュアル SLAM のパフォーマンスを損ないます。
CNN を活用して学習されたローカル特徴は、高レベルの情報を取得する能力を実証し、ベンチマークの照合に優れていますが、連続モーション シーンでは課題に直面し、一般化が不十分になり、ループ検出の精度に影響を与えます。
これらの問題に対処するために、適応的な深い局所特徴を備えた単眼視覚 SLAM システムである DK-SLAM を紹介します。
MAML はこれらの特徴のトレーニングを最適化し、粗いものから細かいものへの特徴追跡アプローチを導入します。
最初に、直接法で連続フレーム間の相対姿勢を近似し、続いて特徴マッチング法を使用して姿勢推定を精緻化します。
累積的な位置決めエラーに対抗するために、新しいオンライン学習バイナリ機能ベースのオンライン ループ クロージャー モジュールがシーケンス内のループ ノードを識別します。
実験結果は、DK-SLAM の有効性を強調し、公的に入手可能なデータセット上の ORB-SLAM3 などの代表的な SLAM ソリューションを上回っています。

要約(オリジナル)

Unreliable feature extraction and matching in handcrafted features undermine the performance of visual SLAM in complex real-world scenarios. While learned local features, leveraging CNNs, demonstrate proficiency in capturing high-level information and excel in matching benchmarks, they encounter challenges in continuous motion scenes, resulting in poor generalization and impacting loop detection accuracy. To address these issues, we present DK-SLAM, a monocular visual SLAM system with adaptive deep local features. MAML optimizes the training of these features, and we introduce a coarse-to-fine feature tracking approach. Initially, a direct method approximates the relative pose between consecutive frames, followed by a feature matching method for refined pose estimation. To counter cumulative positioning errors, a novel online learning binary feature-based online loop closure module identifies loop nodes within a sequence. Experimental results underscore DK-SLAM’s efficacy, outperforms representative SLAM solutions, such as ORB-SLAM3 on publicly available datasets.

arxiv情報

著者 Hao Qu,Lilian Zhang,Jun Mao,Junbo Tie,Xiaofeng He,Xiaoping Hu,Yifei Shi,Changhao Chen
発行日 2024-01-17 12:08:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク