A Framework for Neurosymbolic Robot Action Planning using Large Language Models

要約

シンボリック タスク プランニングは、理解と展開が容易であるため、ロボットの自律性を強化するために広く使用されているアプローチです。
ただし、人間とロボットの相互作用や予期せぬ出来事などにより、頻繁に再計画が必要になる場合、シンボリック タスク計画を現実世界で拡張することは困難です。
計画の長さと計画時間はロボットの効率を妨げ、人間とロボットのインタラクション全体の流暢性に悪影響を与える可能性があります。
我々は、大規模言語モデル (LLM)、つまり GPT-3 を、計画ドメイン定義言語 (PDDL) と互換性のある神経記号的タスク プランナーにトレーニングすることにより、記号的タスク計画と機械学習アプローチの間のギャップを埋めるように設計されたフレームワーク、テリヤキを紹介します。
(i) LLM の応答時間は、シンボリック タスク プランナーの場合のように超線形ではなく、入力と出力の合計の長さに応じて線形に増加するため、計画ドメインの複雑さが増加する限り、スケーラビリティが向上します。
(ii) エンドツーエンドではなくアクションごとに計画を合成し、各アクションが生成されるとすぐに実行できるようにする機能。これにより、計画と実行の同時実行が可能になります。
過去 1 年間、LLM の全体的な認知能力を評価するために研究コミュニティによって多大な努力が払われ、次々と成功を収めてきました。
代わりに、Teriyaki では、先読み予測計画モデルの構築に使用される他の指標で LLM の機能を活用しながら、特定の計画ドメインで従来のプランナーに匹敵する全体的な計画パフォーマンスを提供することを目指しています。
選択したドメインでの予備的な結果は、私たちの方法が次のことができることを示しています。(i) 1000 サンプルのテスト データ セットの問題の 95.5% を解決できます。
(ii) 従来のシンボリック プランナーよりも最大 13.5% 短いプランを作成します。
(iii) プランが利用可能になるまでの平均全体待ち時間を最大 61.4% 削減します。

要約(オリジナル)

Symbolic task planning is a widely used approach to enforce robot autonomy due to its ease of understanding and deployment. However, symbolic task planning is difficult to scale in real-world when frequent re-planning is needed, for example, due to human-robot interactions or unforeseen events. Plan length and planning time can hinder the robot’s efficiency and negatively affect the overall human-robot interaction’s fluency. We present a framework, Teriyaki, designed to bridge the gap between symbolic task planning and machine learning approaches, by training Large Language Models (LLMs), namely GPT-3, into neurosymbolic task planners compatible with the Planning Domain Definition Language (PDDL). Potential benefits include: (i) better scalability in so far as the planning domain complexity increases, since LLMs’ response time linearly scales with the combined length of the input and the output, instead of super-linearly as in the case of symbolic task planners, and (ii) the ability to synthesize a plan action-by-action instead of end-to-end, and to make each action available for execution as soon as it is generated, which in turn enables concurrent planning and execution. In the past year, significant efforts have been devoted by the research community to evaluate the overall cognitive abilities of LLMs, with alternate successes. Instead, with Teriyaki we aim to providing an overall planning performance comparable to traditional planners in specific planning domains, while leveraging LLMs capabilities in other metrics which are used to build a look-ahead predictive planning model. Preliminary results in selected domains show that our method can: (i) solve 95.5% of problems in a test data set of 1000 samples; (ii) produce plans up to 13.5% shorter than a traditional symbolic planner; (iii) reduce average overall waiting times for a plan availability by up to 61.4%.

arxiv情報

著者 Alessio Capitanelli,Fulvio Mastrogiovanni
発行日 2023-12-05 12:51:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO, I.2.6 パーマリンク