要約
オブジェクトゴールナビゲーション(OGN)は、モバイルロボットイメージデータベース(MRID)などの主要なアプリケーションを備えたロボットとAIの基本的なタスクです。
特に、Mapless OGNは、未知の環境または動的環境を含むシナリオでは不可欠です。
この研究の目的は、大規模な言語モデル(LLM)の常識的な推論能力を活用することにより、最近のモジュラーマップレスOGNシステムを強化することを目的としています。
具体的には、フロンティアランキングの問題としてフレーミングすることにより、フロンティアベースの探査で訪問順序を決定するという課題に対処します。
私たちのアプローチは、LLMSがフロンティアの絶対値を決定することはできないが、コンテキストとしてビュー画像を使用して単一の画像内で表示される複数のフロンティア間の相対値を評価することに優れているという最近の調査結果に基づいています。
ランキングモデルとしてLLMを使用して、要素を追加および削除することにより、フロンティアリストを動的に管理します。
ランキング結果は、マルチビュー、マルチクエリ情報融合に最適な相互ランクベクトルとして表されます。
Habitat-SIMの評価を通じて、方法の有効性を検証します。
要約(オリジナル)
Object Goal Navigation (OGN) is a fundamental task for robots and AI, with key applications such as mobile robot image databases (MRID). In particular, mapless OGN is essential in scenarios involving unknown or dynamic environments. This study aims to enhance recent modular mapless OGN systems by leveraging the commonsense reasoning capabilities of large language models (LLMs). Specifically, we address the challenge of determining the visiting order in frontier-based exploration by framing it as a frontier ranking problem. Our approach is grounded in recent findings that, while LLMs cannot determine the absolute value of a frontier, they excel at evaluating the relative value between multiple frontiers viewed within a single image using the view image as context. We dynamically manage the frontier list by adding and removing elements, using an LLM as a ranking model. The ranking results are represented as reciprocal rank vectors, which are ideal for multi-view, multi-query information fusion. We validate the effectiveness of our method through evaluations in Habitat-Sim.
arxiv情報
著者 | Mitsuaki Uno,Kanji Tanaka,Daiki Iwata,Yudai Noda,Shoya Miyazaki,Kouki Terashima |
発行日 | 2025-03-26 05:15:26+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google