Multi-Object Navigation in real environments using hybrid policies

要約

ナビゲーションは、古典的に、SLAM とプランニングの組み合わせを通じてロボット工学で解決されてきました。
最近では、ウェイポイントの計画を超えて、(視覚的な)高レベルの推論の重要なコンポーネントを含む問題がシミュレートされた環境で調査されており、そのほとんどは大規模な機械学習、特に RL、オフライン RL、または模倣学習で対処されています。
これらの方法では、エージェントはローカル プランニング、オブジェクトのマッピング、学習した空間表現のクエリなどのさまざまなスキルを学習する必要があります。
ウェイポイント計画 (PointGoal) などの単純なタスクとは対照的に、これらのより複雑なタスクについては、現在の最先端のモデルがシミュレーションで徹底的に評価されていますが、私たちの知る限りでは、まだ実際の環境では評価されていません。
この作業ではsim2real転送に焦点を当てます。
私たちは、困難なマルチオブジェクト ナビゲーション (Multi-ON) タスクをターゲットにし、それを元の仮想 Multi-ON オブジェクトの実際のレプリカを含む物理環境に移植します。
私たちは、問題を 2 つの異なるスキルに分解するハイブリッド ナビゲーション手法を導入します。(1) ウェイポイント ナビゲーションは、シンボリック プランナーと組み合わせた古典的な SLAM で処理されます。一方、(2) 探索、セマンティック マッピング、および目標の取得は、トレーニングされたディープ ニューラル ネットワークで処理されます。
教師あり学習と RL を組み合わせたものです。
シミュレーションと実際の環境の両方でエンドツーエンドの方法と比較したこのアプローチの利点を示し、このタスクでは SOTA よりも優れたパフォーマンスを示します。

要約(オリジナル)

Navigation has been classically solved in robotics through the combination of SLAM and planning. More recently, beyond waypoint planning, problems involving significant components of (visual) high-level reasoning have been explored in simulated environments, mostly addressed with large-scale machine learning, in particular RL, offline-RL or imitation learning. These methods require the agent to learn various skills like local planning, mapping objects and querying the learned spatial representations. In contrast to simpler tasks like waypoint planning (PointGoal), for these more complex tasks the current state-of-the-art models have been thoroughly evaluated in simulation but, to our best knowledge, not yet in real environments. In this work we focus on sim2real transfer. We target the challenging Multi-Object Navigation (Multi-ON) task and port it to a physical environment containing real replicas of the originally virtual Multi-ON objects. We introduce a hybrid navigation method, which decomposes the problem into two different skills: (1) waypoint navigation is addressed with classical SLAM combined with a symbolic planner, whereas (2) exploration, semantic mapping and goal retrieval are dealt with deep neural networks trained with a combination of supervised learning and RL. We show the advantages of this approach compared to end-to-end methods both in simulation and a real environment and outperform the SOTA for this task.

arxiv情報

著者 Assem Sadek,Guillaume Bono,Boris Chidlovskii,Atilla Baskurt,Christian Wolf
発行日 2024-01-24 20:41:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク