Semantic Mapping in Indoor Embodied AI — A Comprehensive Survey and Future Directions

要約

インテリジェントな身体化エージェント (ロボットなど) は、不慣れな環境で複雑な意味論的なタスクを実行する必要があります。
エージェントが持つ必要がある多くのスキルの中で、長期的なタスクでは環境のセマンティック マップを構築して維持することが最も重要です。
セマンティック マップは環境に関する情報を構造化された方法でキャプチャし、エージェントがタスク全体を通じて高度な推論のためにそれを参照できるようにします。
身体型 AI における既存の調査は、一般的な進歩やナビゲーションや操作などの特定のタスクに焦点を当てていますが、この論文では、身体型 AI、特に屋内ナビゲーションにおけるセマンティック マップ構築アプローチの包括的なレビューを提供します。
これらのアプローチは、その構造表現 (空間グリッド、トポロジカル グラフ、密な点群、またはハイブリッド マップ) と、それらがエンコードする情報の種類 (暗黙的な特徴または明示的な環境データ) に基づいて分類されます。
また、地図構築技術の長所と限界を調査し、現在の課題を強調し、将来の研究の方向性を提案します。
私たちは、この分野がオープン語彙でクエリ可能でタスクに依存しないマップ表現の開発に向かって進んでいる一方で、高いメモリ需要と計算効率の低さが依然として未解決の課題であることを確認しています。
この調査は、現在および将来の研究者が、身体化された AI システムのセマンティック マッピング技術を進歩させるための指針となることを目的としています。

要約(オリジナル)

Intelligent embodied agents (e.g. robots) need to perform complex semantic tasks in unfamiliar environments. Among many skills that the agents need to possess, building and maintaining a semantic map of the environment is most crucial in long-horizon tasks. A semantic map captures information about the environment in a structured way, allowing the agent to reference it for advanced reasoning throughout the task. While existing surveys in embodied AI focus on general advancements or specific tasks like navigation and manipulation, this paper provides a comprehensive review of semantic map-building approaches in embodied AI, specifically for indoor navigation. We categorize these approaches based on their structural representation (spatial grids, topological graphs, dense point-clouds or hybrid maps) and the type of information they encode (implicit features or explicit environmental data). We also explore the strengths and limitations of the map building techniques, highlight current challenges, and propose future research directions. We identify that the field is moving towards developing open-vocabulary, queryable, task-agnostic map representations, while high memory demands and computational inefficiency still remaining to be open challenges. This survey aims to guide current and future researchers in advancing semantic mapping techniques for embodied AI systems.

arxiv情報

著者 Sonia Raychaudhuri,Angel X. Chang
発行日 2025-01-10 06:58:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク