ROMAN: Open-Set Object Map Alignment for Robust View-Invariant Global Localization

要約

グローバルローカリゼーションは、長期的およびドリフトフリーロボットナビゲーションに必要な基本的な能力です。
ただし、現在のメソッドは、大幅に異なる視点に直面した場合、再局在化できません。
オープンセットとビュー不変のオブジェクトのマップを作成および整列させることにより、挑戦的で多様な環境でローカライズできるグローバルローカリゼーション方法であるローマン(堅牢なオブジェクトマップアライメント)を提示します。
ローマンは、統一されたグラフ理論的なグローバルデータ関連アプローチを使用して、オブジェクトサブマップ間の登録問題を策定して解決し、重力方向の前方向とオブジェクトの形状とセマンティックの類似性を斬新に組み込みます。
この作業のオープンセットオブジェクトマッピングと情報豊富なオブジェクトアソシエーションアルゴリズムは、反対方向に移動するロボットからマップが作成されている場合でも、グローバルなローカリゼーションを可能にします。
屋内、都市、および非構造化/森林/森林化された環境での一連の挑戦的なグローバルローカリゼーション実験を通じて、ローマは他の画像ベースのポーズ推定方法またはセグメントベースの登録方法よりも高い相対ポーズ推定精度を達成することを実証します。
さらに、ローマを大規模なマルチロボットスラムのループ閉鎖モジュールとして評価し、ループクロージャーに視覚的な機能を使用した標準のSLAMシステムと比較して、軌道推定誤差の35%の改善を示します。
コードとビデオはhttps://acl.mit.edu/romanにあります。

要約(オリジナル)

Global localization is a fundamental capability required for long-term and drift-free robot navigation. However, current methods fail to relocalize when faced with significantly different viewpoints. We present ROMAN (Robust Object Map Alignment Anywhere), a global localization method capable of localizing in challenging and diverse environments by creating and aligning maps of open-set and view-invariant objects. ROMAN formulates and solves a registration problem between object submaps using a unified graph-theoretic global data association approach with a novel incorporation of a gravity direction prior and object shape and semantic similarity. This work’s open-set object mapping and information-rich object association algorithm enables global localization, even in instances when maps are created from robots traveling in opposite directions. Through a set of challenging global localization experiments in indoor, urban, and unstructured/forested environments, we demonstrate that ROMAN achieves higher relative pose estimation accuracy than other image-based pose estimation methods or segment-based registration methods. Additionally, we evaluate ROMAN as a loop closure module in large-scale multi-robot SLAM and show a 35% improvement in trajectory estimation error compared to standard SLAM systems using visual features for loop closures. Code and videos can be found at https://acl.mit.edu/roman.

arxiv情報

著者 Mason B. Peterson,Yixuan Jia,Yulun Tian,Annika Thomas,Jonathan P. How
発行日 2025-04-28 18:00:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク