Learning Planning Action Models from State Traces


状態トレースから学習する以前の STRIPS ドメイン モデル取得アプローチは、学習するアクションの名前とパラメーターから始まります。
提供される情報に基づいて 2 つのレベルのトレース品質を定義し、それぞれのアルゴリズムを示します。
1 つのレベル (L1) では、トレース内の状態にアクション名が付けられているため、アクションの数と名前を推測できますが、パラメーターの数と種類を把握する必要があります。
もう 1 つのレベル (L2) では、状態は、対応する接地されたアクションのパラメータを構成するオブジェクトでさらにラベル付けされます。
私たちは提案されたアルゴリズムを実験的に評価し、IPC ベンチマークの大規模なコレクションで最先端の学習ツール FAMA と比較します。
評価の結果、新しいアルゴリズムはより高速で、より大きな入力を処理でき、参照モデルにより類似したアクション モデルの学習という点でより良い結果が得られることがわかりました。


Previous STRIPS domain model acquisition approaches that learn from state traces start with the names and parameters of the actions to be learned. Therefore their only task is to deduce the preconditions and effects of the given actions. In this work, we explore learning in situations when the parameters of learned actions are not provided. We define two levels of trace quality based on which information is provided and present an algorithm for each. In one level (L1), the states in the traces are labeled with action names, so we can deduce the number and names of the actions, but we still need to work out the number and types of parameters. In the other level (L2), the states are additionally labeled with objects that constitute the parameters of the corresponding grounded actions. Here we still need to deduce the types of the parameters in the learned actions. We experimentally evaluate the proposed algorithms and compare them with the state-of-the-art learning tool FAMA on a large collection of IPC benchmarks. The evaluation shows that our new algorithms are faster, can handle larger inputs and provide better results in terms of learning action models more similar to reference models.


著者 Tomáš Balyo,Martin Suda,Lukáš Chrpa,Dominik Šafránek,Filip Dvořák,Roman Barták,G. Michael Youngblood
発行日 2024-02-16 14:36:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク