要約
タスク知識のオートマトンベースの表現は、逐次的な意思決定の問題の制御と計画において重要な役割を果たします。
ただし、そのようなオートマトンを構築するために必要な高度なタスクの知識を取得することは、多くの場合困難です。
一方、大規模な生成言語モデル (GLM) は、関連するタスクの知識を自動的に生成できます。
ただし、GLM からのテキスト出力を正式に検証したり、逐次的な意思決定に使用したりすることはできません。
我々は、タスク目標の簡単な自然言語記述から高レベルのタスク知識をエンコードする有限状態オートマトン (FSA) を構築する、GLM2FSA という名前の新しいアルゴリズムを提案します。
GLM2FSA は、まず GLM にクエリを送信してタスクの知識をテキスト形式で抽出し、次にこのテキストベースの知識を表す FSA を構築します。
したがって、提案されたアルゴリズムは、自然言語タスクの記述とオートマトンベースの表現の間のギャップを埋め、構築された FSA をユーザー定義の仕様に対して正式に検証できます。
したがって、検証からの反例などの結果に基づいて、GLM へのクエリを反復的に改良する方法を提案します。
私たちは、日常的なタスク (例: 道路を横断する) と、高度に専門化された知識を必要とするタスク (例: 安全なマルチパーティ計算の実行) のオートマトンベースの表現を構築および洗練する GLM2FSA の能力を実証します。
要約(オリジナル)
Automaton-based representations of task knowledge play an important role in control and planning for sequential decision-making problems. However, obtaining the high-level task knowledge required to build such automata is often difficult. Meanwhile, large-scale generative language models (GLMs) can automatically generate relevant task knowledge. However, the textual outputs from GLMs cannot be formally verified or used for sequential decision-making. We propose a novel algorithm named GLM2FSA, which constructs a finite state automaton (FSA) encoding high-level task knowledge from a brief natural-language description of the task goal. GLM2FSA first sends queries to a GLM to extract task knowledge in textual form, and then it builds an FSA to represent this text-based knowledge. The proposed algorithm thus fills the gap between natural-language task descriptions and automaton-based representations, and the constructed FSA can be formally verified against user-defined specifications. We accordingly propose a method to iteratively refine the queries to the GLM based on the outcomes, e.g., counter-examples, from verification. We demonstrate GLM2FSA’s ability to build and refine automaton-based representations of everyday tasks (e.g., crossing a road), and also of tasks that require highly-specialized knowledge (e.g., executing secure multi-party computation).
arxiv情報
著者 | Yunhao Yang,Jean-Raphaël Gaglione,Cyrus Neary,Ufuk Topcu |
発行日 | 2023-08-09 21:55:36+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google