PLE-SLAM: A Visual-Inertial SLAM Based on Point-Line Features and Efficient IMU Initialization

要約

視覚慣性SLAMは、AR/VR、無人航空機、産業用ロボット、自動運転などのさまざまな分野で不可欠です。
カメラと慣性測定ユニット (IMU) を融合することで信号センサーの欠点を補うことができ、困難な環境における位置特定の精度と堅牢性が大幅に向上します。
堅牢なトラッキングと正確な慣性パラメータ推定は、システムの安定した動作の基礎です。
この記事では、ポイントライン機能と効率的な IMU 初期化に基づいた、完全に正確でリアルタイムの視覚慣性 SLAM アルゴリズムである PLE-SLAM について説明します。
まず、ポイントベースの視覚慣性 SLAM システムにライン特徴を導入します。
並列コンピューティング手法を使用して特徴を抽出し、記述子を計算して、リアルタイムのパフォーマンスを確保します。
第二に、提案されたシステムは、回転事前積分と点と線の観測を使用してジャイロスコープのバイアスを推定します。
加速度計のバイアスと重力方向は解析手法によって解決されます。
初期化後、すべての慣性パラメータは最大事後推定 (MAP) を通じて調整されます。
さらに、動的環境への適応性を向上させるために動的特徴削除スレッドを開き、CNN、バッグオブワード、GNN を使用してループを検出し、特徴を照合します。
DNN ベースのマッチング手法の優れた広ベースライン マッチング機能と照明の堅牢性により、ループ検出リコールとループ間フレーム姿勢推定が大幅に向上します。
フロントエンドとバックエンドはハードウェア アクセラレーション用に設計されています。
実験は公開データセットで実行され、その結果は、提案されたシステムが複雑なシナリオにおける最先端の手法の 1 つであることを示しています。

要約(オリジナル)

Visual-inertial SLAM is essential in various fields, such as AR/VR, uncrewed aerial vehicles, industrial robots, and autonomous driving. The fusion of a camera and inertial measurement unit (IMU) can make up for the shortcomings of a signal sensor, which significantly improves the accuracy and robustness of localization in challenging environments. Robust tracking and accurate inertial parameter estimation are the basis for the stable operation of the system. This article presents PLE-SLAM, an entirely precise and real-time visual-inertial SLAM algorithm based on point-line features and efficient IMU initialization. First, we introduce line features in a point-based visual-inertial SLAM system. We use parallel computing methods to extract features and compute descriptors to ensure real-time performance. Second, the proposed system estimates gyroscope bias with rotation pre-integration and point and line observations. Accelerometer bias and gravity direction are solved by an analytical method. After initialization, all inertial parameters are refined through maximum a posteriori (MAP) estimation. Moreover, we open a dynamic feature elimination thread to improve the adaptability to dynamic environments and use CNN, bag-of-words and GNN to detect loops and match features. Excellent wide baseline matching capability of DNN-based matching method and illumination robustness significantly improve loop detection recall and loop inter-frame pose estimation. The front-end and back-end are designed for hardware acceleration. The experiments are performed on public datasets, and the results show that the proposed system is one of the state-of-the-art methods in complex scenarios.

arxiv情報

著者 Jiaming He,Mingrui Li,Yangyang Wang,Hongyu Wang
発行日 2024-01-02 07:54:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク