Ground Manipulator Primitive Tasks to Executable Actions using Large Language Models

要約

階層化アーキテクチャはロボット システムで広く使用されています。
そのほとんどは、計画と実行の機能を別のレイヤーで実装しています。
ただし、計画層の高レベルのタスクを実行層の低レベルのモーター コマンドに転送する簡単な方法はまだありません。
この課題に取り組むために、大規模言語モデル (LLM) を使用して、マニピュレータの基本タスクをロボットの低レベル アクションに固定する新しいアプローチを提案します。
タスクフレーム形式主義に基づいてプログラムのようなプロンプトを設計しました。
このようにして、LLM がハイブリッド制御用の位置/力設定値を生成できるようにします。
いくつかの最先端の LLM に対する評価が提供されます。

要約(オリジナル)

Layered architectures have been widely used in robot systems. The majority of them implement planning and execution functions in separate layers. However, there still lacks a straightforward way to transit high-level tasks in the planning layer to the low-level motor commands in the execution layer. In order to tackle this challenge, we propose a novel approach to ground the manipulator primitive tasks to robot low-level actions using large language models (LLMs). We designed a program-like prompt based on the task frame formalism. In this way, we enable LLMs to generate position/force set-points for hybrid control. Evaluations over several state-of-the-art LLMs are provided.

arxiv情報

著者 Yue Cao,C. S. George Lee
発行日 2023-08-13 16:52:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク