要約
アクション トレースだけから STRIPS アクション モデルを学習することは、ドメイン述語の学習も必要となるため、困難な問題です。
この研究では、よく知られている LOCM システムと同様にスケーラブルでありながら、SAT アプローチと同様に健全で完全な新しいアプローチが導入されています。
さらに、このアプローチは一般的であり、隠れ領域や述語の数やアリティに制限を課しません。
新しい学習方法は、述語が一連のアクション パターン、つまり特定の引数の位置を持つアクションの影響を受けるという仮定がトレースと一致するかどうかをチェックする \emph{効率的で新しいテスト} に基づいています。
テストに合格した述語とアクション パターンは、学習されたドメインの基礎を提供し、その後、前提条件と静的述語を使用して簡単に完成します。
新しい方法は理論的および実験的に研究されています。
後者の場合、メソッドは、数十万の状態と遷移を含む 8 パズルのような標準的な古典的な領域から取得されたトレースとグラフに基づいて評価されます。
学習された表現は、より大きなインスタンスで検証されます。
要約(オリジナル)
Learning STRIPS action models from action traces alone is a challenging problem as it involves learning the domain predicates as well. In this work, a novel approach is introduced which, like the well-known LOCM systems, is scalable, but like SAT approaches, is sound and complete. Furthermore, the approach is general and imposes no restrictions on the hidden domain or the number or arity of the predicates. The new learning method is based on an \emph{efficient, novel test} that checks whether the assumption that a predicate is affected by a set of action patterns, namely, actions with specific argument positions, is consistent with the traces. The predicates and action patterns that pass the test provide the basis for the learned domain that is then easily completed with preconditions and static predicates. The new method is studied theoretically and experimentally. For the latter, the method is evaluated on traces and graphs obtained from standard classical domains like the 8-puzzle, which involve hundreds of thousands of states and transitions. The learned representations are then verified on larger instances.
arxiv情報
著者 | Jonas Gösgens,Niklas Jansen,Hector Geffner |
発行日 | 2024-11-22 15:09:50+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google