PEANUT: Predicting and Navigating to Unseen Targets


新規環境における効率的なオブジェクトゴールナビゲーション(ObjectNav)には、環境レイアウトの空間的・意味的規則性を理解することが必要である。本研究では、不完全なセマンティックマップから未観測物体の位置を予測することにより、これらの規則性を学習する簡単な方法を提示する。本手法は、フロンティアポテンシャル予測や自己中心的地図補完といった従来の予測型ナビゲーション手法とは異なり、過去に探索した全ての領域からのグローバルな文脈を活用しながら、未観測のターゲットを直接予測するものである。我々の予測モデルは軽量で、比較的少量の受動的な収集データを用いて教師あり方式で学習することが可能である。一度学習したモデルは、強化学習の必要なく、ObjectNavのためのモジュール式パイプラインに組み込むことができる。我々は、HM3DとMP3D ObjectNavデータセットにおいて、本手法の有効性を検証した。その結果、学習に追加データを用いないにもかかわらず、両データセットで最先端技術を達成することが分かった。


Efficient ObjectGoal navigation (ObjectNav) in novel environments requires an understanding of the spatial and semantic regularities in environment layouts. In this work, we present a straightforward method for learning these regularities by predicting the locations of unobserved objects from incomplete semantic maps. Our method differs from previous prediction-based navigation methods, such as frontier potential prediction or egocentric map completion, by directly predicting unseen targets while leveraging the global context from all previously explored areas. Our prediction model is lightweight and can be trained in a supervised manner using a relatively small amount of passively collected data. Once trained, the model can be incorporated into a modular pipeline for ObjectNav without the need for any reinforcement learning. We validate the effectiveness of our method on the HM3D and MP3D ObjectNav datasets. We find that it achieves the state-of-the-art on both datasets, despite not using any additional data for training.


著者 Albert J. Zhai,Shenlong Wang
発行日 2022-12-05 18:58:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, DeepL

カテゴリー: cs.AI, cs.CV, cs.RO パーマリンク