ELA-ZSON: Efficient Layout-Aware Zero-Shot Object Navigation Agent with Hierarchical Planning

要約

複雑なマルチルーム屋内環境向けに設計された効率的なレイアウトアウェアゼロショットオブジェクトナビゲーション(ZSON)アプローチであるEla-Zsonを紹介します。
レイアウト情報と詳細なシーン表現メモリを備えたローカルな命令アプローチを備えたグローバルトポロジーマップを階層的にレバレルすることを計画することにより、ELA-ZSONは効率的かつ効果的なナビゲーションの両方を達成します。
このプロセスは、LLMを搭載したエージェントによって管理され、人間の相互作用、複雑な報酬、または費用のかかるトレーニングを必要とせずに、シームレスな効果的な計画とナビゲーションを確保します。
MP3Dベンチマークでの実験結果は、パス長(SPL)で重み付けされた85 \%オブジェクトナビゲーションの成功率(SR)と79 \%の成功率を達成します(SRの40 \%の改善とSPLの60 \%改善を超えて、exSistingメソッドと比較して)。
さらに、仮想エージェントと実際のロボット展開を介したアプローチの堅牢性を検証し、実際のシナリオでその機能を紹介します。
詳細については、https://anonymous.4open.science/r/ela-zson-c67e/を参照してください。

要約(オリジナル)

We introduce ELA-ZSON, an efficient layout-aware zero-shot object navigation (ZSON) approach designed for complex multi-room indoor environments. By planning hierarchically leveraging a global topologigal map with layout information and local imperative approach with detailed scene representation memory, ELA-ZSON achieves both efficient and effective navigation. The process is managed by an LLM-powered agent, ensuring seamless effective planning and navigation, without the need for human interaction, complex rewards, or costly training. Our experimental results on the MP3D benchmark achieves 85\% object navigation success rate (SR) and 79\% success rate weighted by path length (SPL) (over 40\% point improvement in SR and 60\% improvement in SPL compared to exsisting methods). Furthermore, we validate the robustness of our approach through virtual agent and real-world robotic deployment, showcasing its capability in practical scenarios. See https://anonymous.4open.science/r/ELA-ZSON-C67E/ for details.

arxiv情報

著者 Jiawei Hou,Yuting Xiao,Xiangyang Xue,Taiping Zeng
発行日 2025-05-09 15:39:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク