要約
本稿では、未知の環境における地図なしナビゲーションスキルの獲得に焦点を当てる。適応的なスキルアンサンブル機構を特徴とする新しい強化学習手法であるスキルQネットワーク(SQN)を紹介する。既存の手法とは異なり、我々のモデルは、複数の低レベルのナビゲーションスキルと共に高レベルのスキル決定プロセスを同時に学習する。マップレスナビゲーション用に調整された報酬関数を活用することで、SQNは探索スキルと目標指向スキルの両方を組み込んだ適応的な操縦を学習することができ、新しい環境での効果的なナビゲーションを可能にする。我々の実験は、我々のSQNが複雑な環境を効果的にナビゲートできることを実証し、ベースラインモデルと比較して40%高い性能を示した。SQNは明示的なガイダンスなしに、低レベルのスキルポリシーを組み合わせる方法を発見し、目的地に到達するための目標指向ナビゲーションと、困難なシナリオにおいて局所最小領域から脱出するための探索操作の両方を示す。驚くべきことに、我々の適応的スキルアンサンブル手法は、非凸の障害物や凹凸のある地下のような環境からの未知の観測によって特徴付けられる、分布外の領域へのゼロショット転送を可能にする。
要約(オリジナル)
This paper focuses on the acquisition of mapless navigation skills within unknown environments. We introduce the Skill Q-Network (SQN), a novel reinforcement learning method featuring an adaptive skill ensemble mechanism. Unlike existing methods, our model concurrently learns a high-level skill decision process alongside multiple low-level navigation skills, all without the need for prior knowledge. Leveraging a tailored reward function for mapless navigation, the SQN is capable of learning adaptive maneuvers that incorporate both exploration and goal-directed skills, enabling effective navigation in new environments. Our experiments demonstrate that our SQN can effectively navigate complex environments, exhibiting a 40% higher performance compared to baseline models. Without explicit guidance, SQN discovers how to combine low-level skill policies, showcasing both goal-directed navigations to reach destinations and exploration maneuvers to escape from local minimum regions in challenging scenarios. Remarkably, our adaptive skill ensemble method enables zero-shot transfer to out-of-distribution domains, characterized by unseen observations from non-convex obstacles or uneven, subterranean-like environments.
arxiv情報
著者 | Hyunki Seong,David Hyunchul Shim |
発行日 | 2024-07-05 11:28:26+00:00 |
arxivサイト | arxiv_id(pdf) |