A Framework to Generate Neurosymbolic PDDL-compliant Planners

要約

実世界のロボット アーキテクチャの実行ループに高レベルのタスク プランニングを統合するという問題は、従来のシンボリック プランナーのプランニング時間が、計画するシンボルの数と組み合わせて爆発的に増加するため、依然として困難です。
このホワイト ペーパーでは、Large Language Models (LLM)、特に現在よく知られている GPT-3 モデルを、Planning Domain Definition Language (PDDL) と互換性のある神経記号プランナーにトレーニングするためのフレームワークである Teriyaki を紹介します。
シンボリック アプローチとは異なり、LLM にはトレーニング プロセスが必要です。
ただし、それらの応答時間は、入力と出力を合わせた長さに比例します。
したがって、LLM ベースのプランナーは、テクノロジーが成熟し、よりアクセスしやすくなるにつれて、複雑な計画の問題に対して大幅なパフォーマンスの向上をもたらす可能性があります。
私たちの知る限り、ロボティクスの計画に LLM を使用した最初のこの予備作業では、(i) LLM を PDDL ソルバーとしてトレーニングするための方法論を概説し、(ii) 2 つの困難な PDDL ドメインに対して PDDL 準拠のプランナーを生成し、(iii)
) 取得したプランナーに関連付けられた計画時間と計画の品質をテストし、それらを最新の PDDL プランナーであるプローブと比較します。
結果は、アプローチの実行可能性を確認します。Teriyaki ベースのプランナーは、1000 サンプルのテスト データ セットで問題の 95.5% を解決でき、さらには、使用される従来のプランナーよりも平均で最大 13.5% 短い計画を生成できます。
ドメイン。

要約(オリジナル)

The problem of integrating high-level task planning in the execution loop of a real-world robot architecture remains challenging, as the planning times of traditional symbolic planners explode combinatorially with the number of symbols to plan upon. In this paper, we present Teriyaki, a framework for training Large Language Models (LLMs), and in particular the now well-known GPT-3 model, into neurosymbolic planners compatible with the Planning Domain Definition Language (PDDL). Unlike symbolic approaches, LLMs require a training process. However, their response time scales with the combined length of the input and the output. Hence, LLM-based planners can potentially provide significant performance gains on complex planning problems as the technology matures and becomes more accessible. In this preliminary work, which to our knowledge is the first using LLMs for planning in robotics, we (i) outline a methodology for training LLMs as PDDL solvers, (ii) generate PDDL-compliant planners for two challenging PDDL domains, and (iii) test the planning times and the plan quality associated with the obtained planners, while also comparing them to a state-of-the-art PDDL planner, namely Probe. Results confirm the viability of the approach, with Teriyaki-based planners being able to solve 95.5% of problems in a test data set of 1000 samples, and even generating plans up to 13.5% shorter on average than the employed traditional planner, depending on the domain.

arxiv情報

著者 Alessio Capitanelli,Fulvio Mastrogiovanni
発行日 2023-03-01 11:54:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO, I.2.6 パーマリンク