ForesightNav: Learning Scene Imagination for Efficient Exploration

要約

人間がどのように事前知識を活用して目に見えない環境をナビゲートしながら、探索的な決定を下すことを理解することは、同様の能力を持つ自律的なロボットを開発するために不可欠です。
この作業では、人間の想像力と推論に触発された新しい探索戦略であるForesightnavを提案します。
私たちのアプローチは、未開の地域の占有やセマンティックの詳細などのコンテキスト情報を予測する機能をロボットエージェントに装備しています。
これらの予測により、ロボットは意味のある長期ナビゲーション目標を効率的に選択し、目に見えない環境での探査を大幅に強化することができます。
Structured3Dデータセットを使用して想像力ベースのアプローチを検証し、目に見えないシーンのジオメトリを予測する正確な占有率と優れたパフォーマンスを実証します。
我々の実験は、想像力モジュールが目に見えない環境での探査効率を改善し、PointNavの100%の完了率とStructured3D検証分割のObjectNavで67%のSPLを達成することを示しています。
これらの貢献は、一般化可能で効率的な探査を強化するための自律システムの想像力駆動型の推論の力を示しています。

要約(オリジナル)

Understanding how humans leverage prior knowledge to navigate unseen environments while making exploratory decisions is essential for developing autonomous robots with similar abilities. In this work, we propose ForesightNav, a novel exploration strategy inspired by human imagination and reasoning. Our approach equips robotic agents with the capability to predict contextual information, such as occupancy and semantic details, for unexplored regions. These predictions enable the robot to efficiently select meaningful long-term navigation goals, significantly enhancing exploration in unseen environments. We validate our imagination-based approach using the Structured3D dataset, demonstrating accurate occupancy prediction and superior performance in anticipating unseen scene geometry. Our experiments show that the imagination module improves exploration efficiency in unseen environments, achieving a 100% completion rate for PointNav and an SPL of 67% for ObjectNav on the Structured3D Validation split. These contributions demonstrate the power of imagination-driven reasoning for autonomous systems to enhance generalizable and efficient exploration.

arxiv情報

著者 Hardik Shah,Jiaxu Xing,Nico Messikommer,Boyang Sun,Marc Pollefeys,Davide Scaramuzza
発行日 2025-04-29 14:31:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク