S-Graphs 2.0 — A Hierarchical-Semantic Optimization and Loop Closure for SLAM

要約

3Dシーングラフの階層構造は、人工環境からの一般的なパターンに適合するため、表現目的に高い関連性を示しています。
しかし、さらに、このような階層表現のセマンティックおよび幾何学的情報を活用して、マップ要素とロボットポーズの最適化と管理を高速化することができます。
この方向には、効率的なデータ管理と最適化のために屋内シーンの階層構造を活用する作業状況グラフ2.0(S-Graphs 2.0)を提示します。
私たちのアルゴリズムは、環境を4つのレイヤーに表す状況グラフを構築することから始まります。キーフレーム、壁、部屋、床です。
私たちの最初の斬新さは、階段を識別し、基礎となる層に床レベルのセマンティック関係を割り当てることができる床検出モジュールを含むフロントエンドにあります。
フロアレベルのセマンティクスを使用すると、フロアベースのループ閉鎖戦略を提案することができます。これは、建物の異なるフロア間のエイリアシングのために通常表示される誤検知陽性閉鎖を効果的に拒否します。
私たちの2番目のノベルティは、最適化における表現階層を活用することにあります。
私たちの提案は、(1)4つの表現層にわたる最近のキーフレームと接続されたコンポーネントのウィンドウ上のローカル最適化、(2)フロアレベルのグローバルな最適化。これは、ループ閉鎖中のキーフレームと現在のフロア内の接続のみに焦点を当てており、(3)部屋レベルのローカル最適化、room ridundant keyframesの疎外されたキーフレームがroomを共有します。
さまざまな実際のマルチフロア環境でアルゴリズムを広範囲に検証します。
私たちのアプローチは、競合するベースラインよりも平均して、平均で最大10倍高速な階層表現を推定する大規模なマルチフロア環境における最先端の精度メトリックを示しています。

要約(オリジナル)

The hierarchical structure of 3D scene graphs shows a high relevance for representations purposes, as it fits common patterns from man-made environments. But, additionally, the semantic and geometric information in such hierarchical representations could be leveraged to speed up the optimization and management of map elements and robot poses. In this direction, we present our work Situational Graphs 2.0 (S-Graphs 2.0), which leverages the hierarchical structure of indoor scenes for efficient data management and optimization. Our algorithm begins by constructing a situational graph that represents the environment into four layers: Keyframes, Walls, Rooms, and Floors. Our first novelty lies in the front-end, which includes a floor detection module capable of identifying stairways and assigning floor-level semantic relations to the underlying layers. Floor-level semantics allows us to propose a floor-based loop closure strategy, that effectively rejects false positive closures that typically appear due to aliasing between different floors of a building. Our second novelty lies in leveraging our representation hierarchy in the optimization. Our proposal consists of: (1) local optimization over a window of recent keyframes and their connected components across the four representation layers, (2) floor-level global optimization, which focuses only on keyframes and their connections within the current floor during loop closures, and (3) room-level local optimization, marginalizing redundant keyframes that share observations within the room, which reduces the computational footprint. We validate our algorithm extensively in different real multi-floor environments. Our approach shows state-of-art-art accuracy metrics in large-scale multi-floor environments, estimating hierarchical representations up to 10x faster, in average, than competing baselines

arxiv情報

著者 Hriday Bavle,Jose Luis Sanchez-Lopez,Muhammad Shaheer,Javier Civera,Holger Voos
発行日 2025-02-28 12:23:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO, cs.SE パーマリンク