TwoStep: Multi-agent Task Planning using Classical Planners and Large Language Models

要約

計画ドメイン定義言語(PDDL)などの古典的な計画の定式化が可能な場合は、初期状態を考慮して目標状態を達成することが保証されたアクションシーケンスを認めます。
ただし、PDDLで定義されている推論の問題は、既存のPDDLドメインの大幅な変更と定義なしに、競合する条件がない場合の2つのエージェント間の同時アクションなど、アクションテイクの時間的側面をキャプチャしません。
そのような制約を認識している人間の専門家は、それぞれが単一のエージェント計画を通じて到達可能なサブゴールに目標を分解し、同時の行動を利用することができます。
古典的な計画とは対照的に、プランステップを推測するために直接使用される大規模な言語モデル(LLM)は、実行の成功を保証することはめったにありませんが、アクションシーケンスを組み立てるための共同推論を活用することができます。
マルチエージェント計画目標分解のために人間の直観を近似することにより、古典的な計画とLLMの両方の強度を組み合わせます。
LLMベースの目標分解は、マルチエージェントPDDLの問題を直接解決しながら、単一のエージェントプランだけでなく、ほとんどのマルチエージェントプランよりもプランの実行ステップが少なく、実行の成功を保証するよりも、計画時間が速くなることを実証します。
さらに、LLMベースのサブゴールの近似は、人間の専門家が指定したものと同様のマルチエージェント実行長をもたらすことがわかります。
https://glamer-usc.github.io/twostepのウェブサイトとリソース

要約(オリジナル)

Classical planning formulations like the Planning Domain Definition Language (PDDL) admit action sequences guaranteed to achieve a goal state given an initial state if any are possible. However, reasoning problems defined in PDDL do not capture temporal aspects of action taking, such as concurrent actions between two agents when there are no conflicting conditions, without significant modification and definition to existing PDDL domains. A human expert aware of such constraints can decompose a goal into subgoals, each reachable through single agent planning, to take advantage of simultaneous actions. In contrast to classical planning, large language models (LLMs) directly used for inferring plan steps rarely guarantee execution success, but are capable of leveraging commonsense reasoning to assemble action sequences. We combine the strengths of both classical planning and LLMs by approximating human intuitions for multi-agent planning goal decomposition. We demonstrate that LLM-based goal decomposition leads to faster planning times than solving multi-agent PDDL problems directly while simultaneously achieving fewer plan execution steps than a single agent plan alone, as well as most multiagent plans, while guaranteeing execution success. Additionally, we find that LLM-based approximations of subgoals result in similar multi-agent execution lengths to those specified by human experts. Website and resources at https://glamor-usc.github.io/twostep

arxiv情報

著者 David Bai,Ishika Singh,David Traum,Jesse Thomason
発行日 2025-03-25 23:39:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.MA, cs.RO パーマリンク