Ground Manipulator Primitive Tasks to Executable Actions using Large Language Models

要約

階層化アーキテクチャはロボット システムで広く使用されています。
そのほとんどは、計画と実行の機能を別のレイヤーで実装しています。
ただし、計画層の高レベルのタスクを実行層の低レベルのモーター コマンドに転送する簡単な方法はまだありません。
この課題に取り組むために、大規模言語モデル (LLM) を使用して、マニピュレータの基本タスクをロボットの低レベル アクションに固定する新しいアプローチを提案します。
タスクフレーム形式主義に基づいて、プログラム関数のようなプロンプトを設計しました。
このようにして、LLM がハイブリッド制御用の位置/力設定値を生成できるようにします。
いくつかの最先端の LLM に対する評価が提供されます。

要約(オリジナル)

Layered architectures have been widely used in robot systems. The majority of them implement planning and execution functions in separate layers. However, there still lacks a straightforward way to transit high-level tasks in the planning layer to the low-level motor commands in the execution layer. In order to tackle this challenge, we propose a novel approach to ground the manipulator primitive tasks to robot low-level actions using large language models (LLMs). We designed a program-function-like prompt based on the task frame formalism. In this way, we enable LLMs to generate position/force set-points for hybrid control. Evaluations over several state-of-the-art LLMs are provided.

arxiv情報

著者 Yue Cao,C. S. George Lee
発行日 2023-10-01 03:31:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク