要約
未知のシーンでの視覚的なナビゲーションのコンテキストでは、「探索」と「活用」の両方が同様に重要です。
ロボットはまず探索を通じて環境認識を確立し、次にその認識情報を利用してターゲットの探索を達成する必要があります。
しかし、画像ゴールナビゲーションのための既存の方法のほとんどは、探索行動の生成よりもターゲット検索を優先します。
これに対処するために、暗黙的でコンパクトなシーン表現である NeRF を認知構造として使用する、不確実性駆動探索 (NUE) を伴うナビゲーション パイプラインを提案します。
NeRF の不確実性を推定し、不確実性によって探索能力を強化することで、暗黙的表現の構築を容易にします。
同時に、NeRF から記憶情報を抽出して、ターゲットの位置を決定するロボットの推論能力を強化します。
最終的には、生成された 2 つの機能をシームレスに組み合わせて、ナビゲーション アクションを生成します。
私たちのパイプラインはエンドツーエンドであり、環境認知構造はオンラインで構築されます。
画像ゴールナビゲーションに関する広範な実験結果は、探索行動を強化すると同時に、探索フェーズから活用フェーズへの自然な移行を可能にするパイプラインの機能を実証しています。
これにより、ナビゲーション パフォーマンスの点で、私たちのモデルが既存のメモリベースのコグニティブ ナビゲーション構造よりも優れたパフォーマンスを発揮できるようになります。
要約(オリジナル)
In the context of visual navigation in unknown scenes, both ‘exploration’ and ‘exploitation’ are equally crucial. Robots must first establish environmental cognition through exploration and then utilize the cognitive information to accomplish target searches. However, most existing methods for image-goal navigation prioritize target search over the generation of exploratory behavior. To address this, we propose the Navigation with Uncertainty-driven Exploration (NUE) pipeline, which uses an implicit and compact scene representation, NeRF, as a cognitive structure. We estimate the uncertainty of NeRF and augment the exploratory ability by the uncertainty to in turn facilitate the construction of implicit representation. Simultaneously, we extract memory information from NeRF to enhance the robot’s reasoning ability for determining the location of the target. Ultimately, we seamlessly combine the two generated abilities to produce navigational actions. Our pipeline is end-to-end, with the environmental cognitive structure being constructed online. Extensive experimental results on image-goal navigation demonstrate the capability of our pipeline to enhance exploratory behaviors, while also enabling a natural transition from the exploration to exploitation phase. This enables our model to outperform existing memory-based cognitive navigation structures in terms of navigation performance.
arxiv情報
著者 | Yichen Wang,Qiming Liu,Zhe Liu,Hesheng Wang |
発行日 | 2024-11-05 20:11:41+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google