Topo-Field: Topometric mapping with Brain-inspired Hierarchical Layout-Object-Position Fields

要約

モバイル ロボットが多様な環境で効果的に動作するには、レイアウト、オブジェクト、それらの関係などのコンテキスト情報が豊富な包括的なシーンの理解を必要とします。
神経放射線場 (NeRF) のような進歩により、忠実度の高い 3D 再構成が可能になりますが、計算量が多く、計画やナビゲーションに不可欠な通過可能な空間の効率的な表現が欠けていることがよくあります。
対照的に、トポロジカル マップは計算効率が高いですが、環境をより完全に理解するために必要な意味論的な豊かさに欠けています。
この作品は、高レベルの認知マップを迅速に形成するシーン コンテンツ上の空間レイアウトに強く調整された鼻後皮質 (POR) の人口コードに触発されており、レイアウト – オブジェクト – 位置 (LOP) の関連付けを統合するフレームワークである Topo-Field を導入しています。
ニューラルフィールドを生成し、この学習された表現からトポメトリックマップを構築します。
LOP の関連付けは、オブジェクトとレイアウト情報を明示的にエンコードすることによってモデル化されますが、Large Foundation Model (LFM) 技術により、広範な注釈を付けずに効率的なトレーニングが可能になります。
次に、学習されたニューラル表現をクエリすることによってトポメトリック マップが構築され、意味論的な豊かさと計算効率の両方が提供されます。
マルチルーム環境での経験的評価は、位置属性の推論、クエリのローカライゼーション、トポメトリック プランニングなどのタスクにおける Topo-Field の有効性を実証し、忠実度の高いシーンの理解と効率的なロボット ナビゲーションの間のギャップを埋めることに成功しました。

要約(オリジナル)

Mobile robots require comprehensive scene understanding to operate effectively in diverse environments, enriched with contextual information such as layouts, objects, and their relationships. Although advances like neural radiation fields (NeRFs) offer high-fidelity 3D reconstructions, they are computationally intensive and often lack efficient representations of traversable spaces essential for planning and navigation. In contrast, topological maps are computationally efficient but lack the semantic richness necessary for a more complete understanding of the environment. Inspired by a population code in the postrhinal cortex (POR) strongly tuned to spatial layouts over scene content rapidly forming a high-level cognitive map, this work introduces Topo-Field, a framework that integrates Layout-Object-Position (LOP) associations into a neural field and constructs a topometric map from this learned representation. LOP associations are modeled by explicitly encoding object and layout information, while a Large Foundation Model (LFM) technique allows for efficient training without extensive annotations. The topometric map is then constructed by querying the learned neural representation, offering both semantic richness and computational efficiency. Empirical evaluations in multi-room environments demonstrate the effectiveness of Topo-Field in tasks such as position attribute inference, query localization, and topometric planning, successfully bridging the gap between high-fidelity scene understanding and efficient robotic navigation.

arxiv情報

著者 Jiawei Hou,Wenhao Guan,Longfei Liang,Jianfeng Feng,Xiangyang Xue,Taiping Zeng
発行日 2024-12-25 15:27:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク