要約
未知の環境をナビゲートしてターゲットオブジェクトを見つけることは重要な課題です。
セマンティック情報はナビゲーションにとって重要ですが、特にセマンティックキューが弱い環境では、意思決定のためだけにそれに依存するだけではない場合があります。
さらに、多くの方法は、特に視覚的に類似したオブジェクトを持つ環境で、誤解の影響を受けやすくなります。
これらの制限に対処するために、より効率的で信頼性の高いゼロショットオブジェクトナビゲーションフレームワークであるApexNavを提案します。
効率のために、ApexNavは、環境での分布を分析し、キューが強いときの意味的推論を通じて探索を導き、弱いときに幾何学ベースの探索に切り替えることにより、セマンティック情報を適応的に利用します。
信頼性のために、ターゲットオブジェクトと同様のオブジェクトの長期的なメモリを保存し、誤検出を減らし、タスクの障害を最小化するターゲット中心のセマンティック融合法を提案します。
HM3DV1、HM3DV2、およびMP3DデータセットでApexNavを評価し、SRメトリックとSPLメトリックの両方で最先端の方法を上回ります。
包括的なアブレーション研究は、各モジュールの有効性をさらに示しています。
さらに、実際の実験は、物理的環境におけるApexNavの実用性を検証します。
プロジェクトページはhttps://robotics-star.com/apexnavで入手できます。
要約(オリジナル)
Navigating unknown environments to find a target object is a significant challenge. While semantic information is crucial for navigation, relying solely on it for decision-making may not always be efficient, especially in environments with weak semantic cues. Additionally, many methods are susceptible to misdetections, especially in environments with visually similar objects. To address these limitations, we propose ApexNav, a zero-shot object navigation framework that is both more efficient and reliable. For efficiency, ApexNav adaptively utilizes semantic information by analyzing its distribution in the environment, guiding exploration through semantic reasoning when cues are strong, and switching to geometry-based exploration when they are weak. For reliability, we propose a target-centric semantic fusion method that preserves long-term memory of the target object and similar objects, reducing false detections and minimizing task failures. We evaluate ApexNav on the HM3Dv1, HM3Dv2, and MP3D datasets, where it outperforms state-of-the-art methods in both SR and SPL metrics. Comprehensive ablation studies further demonstrate the effectiveness of each module. Furthermore, real-world experiments validate the practicality of ApexNav in physical environments. Project page is available at https://robotics-star.com/ApexNav.
arxiv情報
著者 | Mingjie Zhang,Yuheng Du,Chengkai Wu,Jinni Zhou,Zhenchao Qi,Jun Ma,Boyu Zhou |
発行日 | 2025-04-22 05:49:29+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google