要約
STRIPSアクションモデルをアクショントレースのみから学習することは、ドメイン述語も学習することになるため、困難な問題である。本研究では、よく知られたLOCMシステムのようにスケーラブルでありながら、SATアプローチのように健全で完全な新しいアプローチを紹介する。さらに、このアプローチは一般的であり、隠れ領域や述語の数やアリティに制約を課さない。この新しい学習法は、述語が一連の行動パターン、すなわち特定の引数位置を持つ行動によって影響を受けるという仮定が、痕跡と矛盾しないかどうかをチェックする、ⅳ効率的で新しいテスト}に基づいている。このテストに合格した述語と行動パターンは、学習されたドメインの基礎となり、その後、前提条件と静的述語で簡単に補完される。この新しい方法は理論的、実験的に研究されている。後者については、数十万の状態と遷移を含む8パズルのような標準的な古典的ドメインから得られたトレースとグラフで評価される。学習された表現は、より大きなインスタンスで検証される。
要約(オリジナル)
Learning STRIPS action models from action traces alone is a challenging problem as it involves learning the domain predicates as well. In this work, a novel approach is introduced which, like the well-known LOCM systems, is scalable, but like SAT approaches, is sound and complete. Furthermore, the approach is general and imposes no restrictions on the hidden domain or the number or arity of the predicates. The new learning method is based on an \emph{efficient, novel test} that checks whether the assumption that a predicate is affected by a set of action patterns, namely, actions with specific argument positions, is consistent with the traces. The predicates and action patterns that pass the test provide the basis for the learned domain that is then easily completed with preconditions and static predicates. The new method is studied theoretically and experimentally. For the latter, the method is evaluated on traces and graphs obtained from standard classical domains like the 8-puzzle, which involve hundreds of thousands of states and transitions. The learned representations are then verified on larger instances.
arxiv情報
著者 | Jonas Gösgens,Niklas Jansen,Hector Geffner |
発行日 | 2025-05-02 14:12:10+00:00 |
arxivサイト | arxiv_id(pdf) |