要約
タスク知識のオートマトンベースの表現は、一連の意思決定問題の制御と計画において重要な役割を果たします。
ただし、そのようなオートマトンを構築するために必要な高レベルのタスク知識を取得することは、多くの場合困難です。
一方、大規模な生成言語モデル (GLM) は、関連するタスクの知識を自動的に生成できます。
ただし、GLM からのテキスト出力を正式に検証したり、逐次的な意思決定に使用したりすることはできません。
GLM2FSA という名前の新しいアルゴリズムを提案します。これは、タスクの目標の簡単な自然言語記述から高レベルのタスク知識をエンコードする有限状態オートマトン (FSA) を構築します。
GLM2FSA は、最初にクエリを GLM に送信してタスクの知識をテキスト形式で抽出し、次にこのテキストベースの知識を表す FSA を構築します。
したがって、提案されたアルゴリズムは、自然言語のタスク記述とオートマトンベースの表現の間のギャップを埋め、構築された FSA はユーザー定義の仕様に対して正式に検証できます。
それに応じて、検証からの反例などの結果に基づいて、GLMへのクエリを繰り返し改良する方法を提案します。
私たちは、GLM2FSA が日常のタスク (道路を横断する、電話をかけるなど) のオートマトンベースの表現を構築および改良する能力を実証します。
要約(オリジナル)
Automaton-based representations of task knowledge play an important role in control and planning for sequential decision-making problems. However, obtaining the high-level task knowledge required to build such automata is often difficult. Meanwhile, large-scale generative language models (GLMs) can automatically generate relevant task knowledge. However, the textual outputs from GLMs cannot be formally verified or used for sequential decision-making. We propose a novel algorithm named GLM2FSA, which constructs a finite state automaton (FSA) encoding high-level task knowledge from a brief natural-language description of the task goal. GLM2FSA first sends queries to a GLM to extract task knowledge in textual form, and then it builds an FSA to represent this text-based knowledge. The proposed algorithm thus fills the gap between natural-language task descriptions and automaton-based representations, and the constructed FSA can be formally verified against user-defined specifications. We accordingly propose a method to iteratively refine the queries to the GLM based on the outcomes, e.g., counter-examples, from verification. We demonstrate GLM2FSA’s ability to build and refine automaton-based representations of everyday tasks (e.g., crossing a road or making a phone call), and also of tasks that require highly-specialized knowledge (e.g., executing secure multi-party computation).
arxiv情報
著者 | Yunhao Yang,Jean-Raphaël Gaglione,Cyrus Neary,Ufuk Topcu |
発行日 | 2023-03-16 15:27:46+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google