要約
人間が伝統的に実行するタスクを引き継ぐことができる完全に自律的なロボットシステムを追求することで、オープンワールド環境の複雑さはかなりの課題をもたらします。
この命令に対処すると、この研究は、ロボットのタスクとモーション計画に適用される大規模な言語モデル(LLM)の分野に貢献しています。
推論、計画、およびモーション生成を含む、複数の認知レベルの間のシームレスな相互作用を調整するシステムアーキテクチャを提案します。
その中心には、生成された計画の物理的、論理的、意味的エラーを処理する新しい再生戦略があります。
提案されたフィードバックアーキテクチャの有効性、特にシミュレーションと2つの複雑な実世界のシナリオのコンテキストでの経験的評価による実行可能性、正確性、および時間の複雑さへの影響を実証します。
要約(オリジナル)
In the pursuit of fully autonomous robotic systems capable of taking over tasks traditionally performed by humans, the complexity of open-world environments poses a considerable challenge. Addressing this imperative, this study contributes to the field of Large Language Models (LLMs) applied to task and motion planning for robots. We propose a system architecture that orchestrates a seamless interplay between multiple cognitive levels, encompassing reasoning, planning, and motion generation. At its core lies a novel replanning strategy that handles physically grounded, logical, and semantic errors in the generated plans. We demonstrate the efficacy of the proposed feedback architecture, particularly its impact on executability, correctness, and time complexity via empirical evaluation in the context of a simulation and two intricate real-world scenarios: blocks world, barman and pizza preparation.
arxiv情報
著者 | Frank Joublin,Antonello Ceravola,Pavel Smirnov,Felix Ocker,Joerg Deigmoeller,Anna Belardinelli,Chao Wang,Stephan Hasler,Daniel Tanneberg,Michael Gienger |
発行日 | 2025-03-14 13:03:24+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google