要約
計画のための学習のための現在のアプローチは、いくつかの領域で従来のプランナーと競合するパフォーマンスをまだ達成しておらず、全体的なパフォーマンスが劣っています。
この研究では、リフトされた計画タスクの新しいグラフ表現を構築し、WL アルゴリズムを使用してそれらから特徴を生成します。
これらの機能は、モデルを計画するための最先端の深層学習よりもパラメーターが最大 2 桁少なく、最大 3 桁高速にトレーニングされる古典的な機械学習手法で使用されます。
私たちの新しいアプローチである WL-GOOSE は、ヒューリスティックをゼロから確実に学習し、公正な競争環境において $h^{\text{FF}}$ ヒューリスティックを上回るパフォーマンスを発揮します。
また、カバレッジに関しては 10 ドメイン中 4 ドメイン、プランの品質に関しては 10 ドメイン中 7 で LAMA を上回ったり、同等のパフォーマンスを示しています。
WL-GOOSE は、これらの偉業を達成する最初の計画学習モデルです。
さらに、新しい WL 特徴生成方法、以前の理論的にフレーバー化された学習アーキテクチャ、および計画のための記述ロジック特徴の間の関連性を研究します。
要約(オリジナル)
Current approaches for learning for planning have yet to achieve competitive performance against classical planners in several domains, and have poor overall performance. In this work, we construct novel graph representations of lifted planning tasks and use the WL algorithm to generate features from them. These features are used with classical machine learning methods which have up to 2 orders of magnitude fewer parameters and train up to 3 orders of magnitude faster than the state-of-the-art deep learning for planning models. Our novel approach, WL-GOOSE, reliably learns heuristics from scratch and outperforms the $h^{\text{FF}}$ heuristic in a fair competition setting. It also outperforms or ties with LAMA on 4 out of 10 domains on coverage and 7 out of 10 domains on plan quality. WL-GOOSE is the first learning for planning model which achieves these feats. Furthermore, we study the connections between our novel WL feature generation method, previous theoretically flavoured learning architectures, and Description Logic Features for planning.
arxiv情報
著者 | Dillon Z. Chen,Felipe Trevizan,Sylvie Thiébaux |
発行日 | 2024-03-25 07:47:52+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google