OpenBench: A New Benchmark and Baseline for Semantic Navigation in Smart Logistics

要約

Smart Logisticsでの効率的なラストマイル配信の需要の増加は、運用効率を高め、コストを削減する上での自律的なロボットの役割を強調しています。
高精度マップに依存する従来のナビゲーション方法はリソース集約型ですが、学習ベースのアプローチは多くの場合、実際のシナリオで一般化に苦労しています。
これらの課題に対処するために、この作業は、基礎モデルとスケーラブルな屋外ナビゲーションのための古典的なアルゴリズムを組み合わせたOpenStreetMapが強化したオープンエアセマンティックナビゲーション(OPEN)システムを提案します。
このシステムは、柔軟なマップ表現に既製のOpenStreetMap(OSM)を使用して、広範な事前マッピングの取り組みの必要性を排除します。
また、大規模な言語モデル(LLM)を採用して、グローバルローカリゼーション、マップ更新、およびハウス番号認識のために配信指示とビジョン言語モデル(VLM)を理解します。
ラストマイル配信の評価に不十分な既存のベンチマークの制限を補うために、この作業は、自律配信システムが直面する現実世界の課題を反映した、住宅地での屋外ナビゲーションのために特別に設計された新しいベンチマークを導入します。
シミュレートされた現実世界環境での広範な実験は、ナビゲーションの効率と信頼性の向上における提案されたシステムの有効性を示しています。
さらなる研究を促進するために、私たちのコードとベンチマークは公開されています。

要約(オリジナル)

The increasing demand for efficient last-mile delivery in smart logistics underscores the role of autonomous robots in enhancing operational efficiency and reducing costs. Traditional navigation methods, which depend on high-precision maps, are resource-intensive, while learning-based approaches often struggle with generalization in real-world scenarios. To address these challenges, this work proposes the Openstreetmap-enhanced oPen-air sEmantic Navigation (OPEN) system that combines foundation models with classic algorithms for scalable outdoor navigation. The system uses off-the-shelf OpenStreetMap (OSM) for flexible map representation, thereby eliminating the need for extensive pre-mapping efforts. It also employs Large Language Models (LLMs) to comprehend delivery instructions and Vision-Language Models (VLMs) for global localization, map updates, and house number recognition. To compensate the limitations of existing benchmarks that are inadequate for assessing last-mile delivery, this work introduces a new benchmark specifically designed for outdoor navigation in residential areas, reflecting the real-world challenges faced by autonomous delivery systems. Extensive experiments in simulated and real-world environments demonstrate the proposed system’s efficacy in enhancing navigation efficiency and reliability. To facilitate further research, our code and benchmark are publicly available.

arxiv情報

著者 Junhui Wang,Dongjie Huo,Zehui Xu,Yongliang Shi,Yimin Yan,Yuanxin Wang,Chao Gao,Yan Qiao,Guyue Zhou
発行日 2025-02-13 11:55:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク