要約
SLAM に関する最近の研究では、ポーズ グラフを、それらの間の関係を利用するルームのような高レベルのセマンティック概念で拡張し、状況/環境のより豊かな表現を提供するだけでなく、その推定の精度も向上させています。
具体的には、私たちの前作であるシチュエーション グラフ (S-Graphs+) は、因子最適化プロセスでセマンティックな関係を共同利用するパイオニアであり、関係が数学的に定義されている Planes や Rooms などのセマンティック エンティティに依存しています。
それにもかかわらず、さまざまな性質の高レベルの概念に対応する、低レベルのファクター グラフ内のすべての隠れたパターンを見つける独自のアプローチはありません。
現在、アドホック アルゴリズムに取り組んでおり、グラフの表現力が制限されています。
この制限を克服するために、この研究では、低レベルのファクター グラフから推論できる高レベルの意味関係概念を学習するための、グラフ ニューラル ネットワークに基づくアルゴリズムを提案します。
マップされたプレーンのセットが与えられると、アルゴリズムはプレーンに関連する Room エンティティを推論できます。
さらに、私たちの方法の多用途性を実証するために、私たちのアルゴリズムは追加の意味関係概念、つまり壁とその平面との関係を推論できます。
シミュレートされたデータセットと実際のデータセットの両方でメソッドを検証し、2 つのベースライン アプローチよりもパフォーマンスが向上していることを示しています。
さらに、私たちの手法を S-Graphs+ アルゴリズムに統合し、ベースラインと比較してポーズとマップの精度を向上させながら、シーン表現をさらに強化しました。
要約(オリジナル)
Recent works on SLAM extend their pose graphs with higher-level semantic concepts like Rooms exploiting relationships between them, to provide, not only a richer representation of the situation/environment but also to improve the accuracy of its estimation. Concretely, our previous work, Situational Graphs (S-Graphs+), a pioneer in jointly leveraging semantic relationships in the factor optimization process, relies on semantic entities such as Planes and Rooms, whose relationship is mathematically defined. Nevertheless, there is no unique approach to finding all the hidden patterns in lower-level factor-graphs that correspond to high-level concepts of different natures. It is currently tackled with ad-hoc algorithms, which limits its graph expressiveness. To overcome this limitation, in this work, we propose an algorithm based on Graph Neural Networks for learning high-level semantic-relational concepts that can be inferred from the low-level factor graph. Given a set of mapped Planes our algorithm is capable of inferring Room entities relating to the Planes. Additionally, to demonstrate the versatility of our method, our algorithm can infer an additional semantic-relational concept, i.e. Wall, and its relationship with its Planes. We validate our method in both simulated and real datasets demonstrating improved performance over two baseline approaches. Furthermore, we integrate our method into the S-Graphs+ algorithm providing improved pose and map accuracy compared to the baseline while further enhancing the scene representation.
arxiv情報
著者 | Jose Andres Millan-Romera,Hriday Bavle,Muhammad Shaheer,Martin R. Oswald,Holger Voos,Jose Luis Sanchez-Lopez |
発行日 | 2024-03-22 16:32:24+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google