要約
大規模言語モデル (LLM) は、複雑なロボット タスクを実行するために広く利用されています。
ただし、作業中に外部からの妨害に対処することはまだ未解決の課題です。
この論文では、LLM と動作ツリー (BT) に基づいてロボットの適応タスクを実現する新しい方法を提案します。
ChatGPT を利用して、タスクの説明手順を推論します。
ChatGPT が環境を理解できるようにするために、オブジェクト認識アルゴリズムによってセマンティック マップが構築されます。
次に、これらのステップを初期 BT に解析するために、Bidirectional Encoder Representations from Transformers (BERT) に基づいてパーサー モジュールを設計します。
続いて、適応タスクを実行するロボットを制御するために初期 BT を動的に拡張する BT 更新アルゴリズムが提案されています。
複雑なロボットタスクのための他のLLMベースの方法とは異なり、私たちの方法は、環境の変化に応じて新しいアクションを追加および実行できる可変BTを出力し、外乱に対して堅牢です。
私たちの方法は、さまざまな実際のシナリオでのシミュレーションによって検証されています。
要約(オリジナル)
Large Language Models (LLMs) have been widely utilized to perform complex robotic tasks. However, handling external disturbances during tasks is still an open challenge. This paper proposes a novel method to achieve robotic adaptive tasks based on LLMs and Behavior Trees (BTs). It utilizes ChatGPT to reason the descriptive steps of tasks. In order to enable ChatGPT to understand the environment, semantic maps are constructed by an object recognition algorithm. Then, we design a Parser module based on Bidirectional Encoder Representations from Transformers (BERT) to parse these steps into initial BTs. Subsequently, a BTs Update algorithm is proposed to expand the initial BTs dynamically to control robots to perform adaptive tasks. Different from other LLM-based methods for complex robotic tasks, our method outputs variable BTs that can add and execute new actions according to environmental changes, which is robust to external disturbances. Our method is validated with simulation in different practical scenarios.
arxiv情報
著者 | Haotian Zhou,Yunhan Lin,Longwu Yan,Jihong Zhu,Huasong Min |
発行日 | 2024-04-08 01:25:38+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google