Memory-Augmented Reinforcement Learning for Image-Goal Navigation

要約

この作業では、イメージ ゴール ナビゲーションのためのメモリ拡張アプローチを提示します。
RL ベースおよび SLAM ベースのアプローチを含む以前の試みは、一般化のパフォーマンスが低いか、ポーズ/深度センサーに大きく依存していました。
私たちの方法は、エピソード記憶を活用してナビゲートすることを学習する、注意ベースのエンドツーエンド モデルに基づいています。
最初に、状態埋め込みネットワークを自己監視方式でトレーニングし、それを使用して以前に訪れた状態をエージェントのメモリに埋め込みます。
私たちのナビゲーション ポリシーは、アテンション メカニズムを通じてこの情報を利用します。
広範な評価でアプローチを検証し、モデルが挑戦的なギブソン データセットで新しい最先端技術を確立することを示します。
さらに、関連する研究とはまったく対照的に、位置や深さなどの追加情報にアクセスすることなく、RGB 入力のみからこの印象的なパフォーマンスを実現します。

要約(オリジナル)

In this work, we present a memory-augmented approach for image-goal navigation. Earlier attempts, including RL-based and SLAM-based approaches have either shown poor generalization performance, or are heavily-reliant on pose/depth sensors. Our method is based on an attention-based end-to-end model that leverages an episodic memory to learn to navigate. First, we train a state-embedding network in a self-supervised fashion, and then use it to embed previously-visited states into the agent’s memory. Our navigation policy takes advantage of this information through an attention mechanism. We validate our approach with extensive evaluations, and show that our model establishes a new state of the art on the challenging Gibson dataset. Furthermore, we achieve this impressive performance from RGB input alone, without access to additional information such as position or depth, in stark contrast to related work.

arxiv情報

著者 Lina Mezghani,Sainbayar Sukhbaatar,Thibaut Lavril,Oleksandr Maksymets,Dhruv Batra,Piotr Bojanowski,Karteek Alahari
発行日 2022-09-12 12:19:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク