要約
大規模な言語モデル(LLM)はロボットプランナーとして有望であることを示していますが、特に外部の知識を必要とする特別な環境では、長老や複雑なタスクに苦労することがよくあります。
階層的な計画と検索の高等発電(RAG)はこれらの課題のいくつかに対処していますが、より信頼性の高いシステムを達成するには、それ自体が不十分なままであり、より深い統合が必要です。
この目的のために、階層的な計画生成のための知識グラフベースのRAGでLLMSベースのプランナーを強化するニューロ – シンボリックアプローチを提案します。
このメソッドは、複雑なタスクを管理可能なサブタスクに分解し、さらに実行可能なアトミックアクションシーケンスに拡大しました。
正式な正確性と適切な分解を確保するために、予想された世界状態と観測された世界状態を調整することにより、故障検出器としても機能するシンボリック検証装置を統合します。
ベースライン方法に対する私たちの評価は、さまざまな複雑さと異なるLLMのタスクを介して、階層的計画、象徴的な検証、およびぼろを統合することの一貫した重要な利点を示しています。
さらに、実験セットアップと新しいメトリックは、複雑な計画のアプローチを検証するだけでなく、LLMSの推論と構成能力を評価するためのツールとしても機能します。
要約(オリジナル)
Large Language Models (LLMs) have shown promise as robotic planners but often struggle with long-horizon and complex tasks, especially in specialized environments requiring external knowledge. While hierarchical planning and Retrieval-Augmented Generation (RAG) address some of these challenges, they remain insufficient on their own and a deeper integration is required for achieving more reliable systems. To this end, we propose a neuro-symbolic approach that enhances LLMs-based planners with Knowledge Graph-based RAG for hierarchical plan generation. This method decomposes complex tasks into manageable subtasks, further expanded into executable atomic action sequences. To ensure formal correctness and proper decomposition, we integrate a Symbolic Validator, which also functions as a failure detector by aligning expected and observed world states. Our evaluation against baseline methods demonstrates the consistent significant advantages of integrating hierarchical planning, symbolic verification, and RAG across tasks of varying complexity and different LLMs. Additionally, our experimental setup and novel metrics not only validate our approach for complex planning but also serve as a tool for assessing LLMs’ reasoning and compositional capabilities.
arxiv情報
著者 | Cristina Cornelio,Flavio Petruzzellis,Pietro Lio |
発行日 | 2025-04-06 18:36:30+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google