Monocular Simultaneous Localization and Mapping using Ground Textures

要約

最近の研究では、下向きの単眼カメラで撮影された地面のテクスチャの画像のみを使用して、印象的なローカリゼーション パフォーマンスが示されています。
これにより、まばらな環境や困難な照明条件を特徴とする堅牢な信頼性の高いナビゲーション方法が提供されます。
ただし、これらのローカリゼーション方法では、比較のために既存のマップが必要です。
私たちの仕事は、完全な同時ローカリゼーションとマッピング (SLAM) システムを導入することで、マップの必要性を緩和することを目的としています。
既存のマップを必要としないため、セットアップ時間が最小限に抑えられ、システムは変化する環境に対してより堅牢になります。
この SLAM システムは、これを実現するためにいくつかの手法を組み合わせて使用​​します。
画像のキーポイントが識別され、地面に投影されます。
次に、これらのキーポイント、視覚的な単語の袋、およびいくつかのしきい値パラメーターを使用して、重複する画像と再訪した領域を識別します。
次に、システムはロバストな M 推定量を使用して、重なり合う画像と再訪エリアを持つロボットのポーズ間の変換を推定します。
これらの最適化された推定値は、ナビゲーションに使用されるマップを構成します。
実験データを通じて、このシステムが多くの地面テクスチャで確実に機能することを示していますが、すべてではありません。

要約(オリジナル)

Recent work has shown impressive localization performance using only images of ground textures taken with a downward facing monocular camera. This provides a reliable navigation method that is robust to feature sparse environments and challenging lighting conditions. However, these localization methods require an existing map for comparison. Our work aims to relax the need for a map by introducing a full simultaneous localization and mapping (SLAM) system. By not requiring an existing map, setup times are minimized and the system is more robust to changing environments. This SLAM system uses a combination of several techniques to accomplish this. Image keypoints are identified and projected into the ground plane. These keypoints, visual bags of words, and several threshold parameters are then used to identify overlapping images and revisited areas. The system then uses robust M-estimators to estimate the transform between robot poses with overlapping images and revisited areas. These optimized estimates make up the map used for navigation. We show, through experimental data, that this system performs reliably on many ground textures, but not all.

arxiv情報

著者 Kyle M. Hart,Brendan Englot,Ryan P. O’Shea,John D. Kelly,David Martinez
発行日 2023-03-10 14:27:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク