Understanding the Capabilities of Large Language Models for Automated Planning

要約

自動計画は、特定の環境で特定の目標を達成するための計画やアクションのシーケンスを生成する効率的なアルゴリズムの開発に関係します。
新しい大規模言語モデル (LLM) は、質問に答え、高品質のプログラミング コードを記述し、タンパク質のフォールディングを予測することができ、言語ベースの問題を超えたさまざまなタスクを解決する多用途性を示しています。
このペーパーでは、LLM を自動計画にどのように使用できるかを調査することを目的としています。
そのために、私たちは 4 つの重要な質問に答えようとします。
まず、LLM が計画生成にどの程度使用できるかを理解したいと思います。
次に、計画の作成を促進するのに最も効果的な事前トレーニング データを特定することを目的としています。
第三に、微調整とプロンプトのどちらが計画作成のより効果的なアプローチであるかを調査します。
最後に、LLM が計画を一般化できるかどうかを検討します。
この研究では、これらの質問に答えることで、複雑な計画問題を解決する際の LLM の機能に光を当て、この状況で LLM を使用するための最も効果的なアプローチについての洞察を提供することを目指しています。

要約(オリジナル)

Automated planning is concerned with developing efficient algorithms to generate plans or sequences of actions to achieve a specific goal in a given environment. Emerging Large Language Models (LLMs) can answer questions, write high-quality programming code, and predict protein folding, showcasing their versatility in solving various tasks beyond language-based problems. In this paper, we aim to explore how LLMs can also be used for automated planning. To do so, we seek to answer four key questions. Firstly, we want to understand the extent to which LLMs can be used for plan generation. Secondly, we aim to identify which pre-training data is most effective in facilitating plan generation. Thirdly, we investigate whether fine-tuning or prompting is a more effective approach for plan generation. Finally, we explore whether LLMs are capable of plan generalization. By answering these questions, the study seeks to shed light on the capabilities of LLMs in solving complex planning problems and provide insights into the most effective approaches for using LLMs in this context.

arxiv情報

著者 Vishal Pallagani,Bharath Muppasani,Keerthiram Murugesan,Francesca Rossi,Biplav Srivastava,Lior Horesh,Francesco Fabiano,Andrea Loreggia
発行日 2023-05-25 15:21:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク