要約
自律ロボット工学の分野、特に未踏の環境内での物体検索タスクを進歩させるために、私たちは Probable Object Location (POLo) スコアを中心とした新しいフレームワークを導入します。
3D オブジェクト確率マップを利用する POLo スコアにより、エージェントは効率的なオブジェクト検索のためにデータに基づいた決定を下すことができます。
計算集約型の POLo スコアを近似するようにトレーニングされたニューラル ネットワークである POLoNet を導入することで、フレームワークの実用性をさらに強化します。
私たちのアプローチは、長期タスクによるメモリの減衰に悩まされるエンドツーエンドの強化学習手法と、可視性の制約を無視する従来のマップベースの手法の両方の重大な制限に対処します。
OVMM 2023 チャレンジの第 1 フェーズに関わる私たちの実験では、POLoNet を備えたエージェントが、エンドツーエンドの RL 技術や以前のマップベースの戦略など、さまざまなベースライン手法を大幅に上回るパフォーマンスを示しました。
包括的な評価を提供するために、オブジェクトの目標ナビゲーションにおけるさまざまなエージェントの効率と有効性についての洞察を提供する新しいパフォーマンス指標を導入します。
要約(オリジナル)
To advance the field of autonomous robotics, particularly in object search tasks within unexplored environments, we introduce a novel framework centered around the Probable Object Location (POLo) score. Utilizing a 3D object probability map, the POLo score allows the agent to make data-driven decisions for efficient object search. We further enhance the framework’s practicality by introducing POLoNet, a neural network trained to approximate the computationally intensive POLo score. Our approach addresses critical limitations of both end-to-end reinforcement learning methods, which suffer from memory decay over long-horizon tasks, and traditional map-based methods that neglect visibility constraints. Our experiments, involving the first phase of the OVMM 2023 challenge, demonstrate that an agent equipped with POLoNet significantly outperforms a range of baseline methods, including end-to-end RL techniques and prior map-based strategies. To provide a comprehensive evaluation, we introduce new performance metrics that offer insights into the efficiency and effectiveness of various agents in object goal navigation.
arxiv情報
著者 | Jiaming Wang,Harold Soh |
発行日 | 2023-11-14 08:45:32+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google