EMPOWER: Embodied Multi-role Open-vocabulary Planning with Online Grounding and Execution

要約

現実の環境におけるロボットのタスク計画には、大きな課題が伴います。
これらの課題は、次の 3 つの主な問題から生じています。1 つは、目標を達成するための根拠のある一連のステップを特定することの難しさです。
高レベルのアクションと低レベルのコマンド間の標準化されたマッピングの欠如。
そして、ロボット ハードウェアのリソースが限られているため、計算オーバーヘッドを低く維持するという課題があります。
これらの問題に対処することを目的とした、オープンボキャブラリーのオンライングラウンディングと具体的なエージェントの計画のために設計されたフレームワークである EMPOWER を紹介します。
EMPOWER は、効率的な事前トレーニング済みの基礎モデルと複数の役割のメカニズムを活用することにより、地に足の着いた計画と実行において顕著な改善を示しています。
定量的な結果は、TIAGo ロボットを使用した 6 つの異なる実際のシナリオ全体で平均成功率 0.73 を達成し、当社のアプローチの有効性を強調しています。

要約(オリジナル)

Task planning for robots in real-life settings presents significant challenges. These challenges stem from three primary issues: the difficulty in identifying grounded sequences of steps to achieve a goal; the lack of a standardized mapping between high-level actions and low-level commands; and the challenge of maintaining low computational overhead given the limited resources of robotic hardware. We introduce EMPOWER, a framework designed for open-vocabulary online grounding and planning for embodied agents aimed at addressing these issues. By leveraging efficient pre-trained foundation models and a multi-role mechanism, EMPOWER demonstrates notable improvements in grounded planning and execution. Quantitative results highlight the effectiveness of our approach, achieving an average success rate of 0.73 across six different real-life scenarios using a TIAGo robot.

arxiv情報

著者 Francesco Argenziano,Michele Brienza,Vincenzo Suriani,Daniele Nardi,Domenico D. Bloisi
発行日 2024-10-22 16:58:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク