Conformal Temporal Logic Planning using Large Language Models


私たちは、自然言語 (NL) で表現された複数の高レベルのサブタスクを時間的かつ論理的な順序で達成する必要があるミッションを検討します。
ミッションを正式に定義するために、これらのサブタスクを線形時相論理 (LTL) 式のアトミック述語として扱います。
このタスク仕様フレームワークを LTL-NL と呼びます。
私たちの目標は、LTL-NL タスクを達成するロボットの一連の動作として定義される計画を設計することです。
このアクション計画の問題は、アトミック述語の NL の性質により、既存の LTL プランナーでは直接解決できません。
これに対処するために、我々は HERACLE を提案します。これは、(i) NL サブタスクを実行する順序を決定する高レベルのタスク プランを生成する既存の記号プランナー、
(ii) これらのタスク計画に基づいてロボットの動作シーケンスを設計するための、事前トレーニング済みの大規模言語モデル (LLM)。
(iii) (i) と (ii) の間の正式なインターフェイスとして機能し、LLM の不完全性による不確実性を管理する共形予測。
私たちは理論的にも経験的にも、HERACLE がユーザー定義のミッション成功率を達成できることを示しています。
最後に、NL のみを使用してミッションを定義する必要がある LLM ベースのプランナーよりも HERACLE が優れていることを実証する比較実験を提供します。


This paper addresses planning problems for mobile robots. We consider missions that require accomplishing multiple high-level sub-tasks, expressed in natural language (NL), in a temporal and logical order. To formally define the mission, we treat these sub-tasks as atomic predicates in a Linear Temporal Logic (LTL) formula. We refer to this task specification framework as LTL-NL. Our goal is to design plans, defined as sequences of robot actions, accomplishing LTL-NL tasks. This action planning problem cannot be solved directly by existing LTL planners because of the NL nature of atomic predicates. To address it, we propose HERACLEs, a hierarchical neuro-symbolic planner that relies on a novel integration of (i) existing symbolic planners generating high-level task plans determining the order at which the NL sub-tasks should be accomplished; (ii) pre-trained Large Language Models (LLMs) to design sequences of robot actions based on these task plans; and (iii) conformal prediction acting as a formal interface between (i) and (ii) and managing uncertainties due to LLM imperfections. We show, both theoretically and empirically, that HERACLEs can achieve user-defined mission success rates. Finally, we provide comparative experiments demonstrating that HERACLEs outperforms LLM-based planners that require the mission to be defined solely using NL. Additionally, we present examples demonstrating that our approach enhances user-friendliness compared to conventional symbolic approaches.


著者 Jun Wang,Jiaming Tong,Kaiyuan Tan,Yevgeniy Vorobeychik,Yiannis Kantaros
発行日 2024-08-08 14:56:23+00:00
