Can only LLMs do Reasoning?: Potential of Small Language Models in Task Planning

要約

ロボット工学では、特に人間のコマンドを理解するために、大規模言語モデル (LLM) の使用が普及しつつあります。
特に、LLM は、人間による高レベルのコマンドに対するドメインに依存しないタスク プランナーとして利用されます。
LLM は思考連鎖 (CoT) 推論が可能であり、これにより LLM はタスク プランナーになることができます。
ただし、現代のロボットは依然として複雑な動作を実行するのに苦労しており、ロボットを導入できる領域は実際には限られていることを考慮する必要があります。
これにより、私たちは次のような疑問を抱くようになります。もし小さな LM が単一ドメイン内で連鎖的に推論するように訓練できるとしたら、たとえ小さな LM であってもロボットにとって優れたタスク プランナーとなるでしょうか?
小規模な LM を連鎖的に推論するようにトレーニングするために、LLM を介して、高レベルのコマンドと対応する実行可能な低レベルのステップで構成される「COMmand-STeps データセット」(COST) を構築します。
データセットだけでなく、その生成に使用されるプロンプト テンプレートもリリースし、誰でも自分のドメイン用のデータセットを構築できるようにします。
GPT3.5 および GPT4 を、タスク領域向けに微調整された GPT2 とテーブルトップおよびキッチン環境で比較しました。その結果、特定の領域でのタスク計画において GPT2-medium が GPT3.5 に匹敵することがわかりました。
データセット、コード、その他の出力サンプルは、https://github.com/Gawon-Choi/small-LMs-Task-Planning にあります。

要約(オリジナル)

In robotics, the use of Large Language Models (LLMs) is becoming prevalent, especially for understanding human commands. In particular, LLMs are utilized as domain-agnostic task planners for high-level human commands. LLMs are capable of Chain-of-Thought (CoT) reasoning, and this allows LLMs to be task planners. However, we need to consider that modern robots still struggle to perform complex actions, and the domains where robots can be deployed are limited in practice. This leads us to pose a question: If small LMs can be trained to reason in chains within a single domain, would even small LMs be good task planners for the robots? To train smaller LMs to reason in chains, we build `COmmand-STeps datasets’ (COST) consisting of high-level commands along with corresponding actionable low-level steps, via LLMs. We release not only our datasets but also the prompt templates used to generate them, to allow anyone to build datasets for their domain. We compare GPT3.5 and GPT4 with the finetuned GPT2 for task domains, in tabletop and kitchen environments, and the result shows that GPT2-medium is comparable to GPT3.5 for task planning in a specific domain. Our dataset, code, and more output samples can be found in https://github.com/Gawon-Choi/small-LMs-Task-Planning

arxiv情報

著者 Gawon Choi,Hyemin Ahn
発行日 2024-04-05 04:58:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク