Action Model Learning with Guarantees

要約

この論文では、完全な可観測性を備えたアクション モデル学習の問題を研究します。
ミッチェルによる検索による学習パラダイムに従って、学習例と一致する仮説の検索としてタスクを解釈するバージョン空間に基づくアクション モデル学習の理論を開発します。
私たちの理論的発見は、問題のすべての解決策のコンパクトな表現を維持するオンライン アルゴリズムでインスタンス化されます。
これらの一連のソリューションの中で、実際の遷移システムを下から (サウンド モデル) と上から (完全なモデル) から近似するアクション モデルに注目します。
学習アルゴリズムの出力を操作して、健全なモデルと完全なモデルの決定論的定式化と非決定論的定式化を構築する方法を示し、十分な例があれば、両方の定式化がまったく同じ真のモデルに収束することを証明します。
私たちの実験では、さまざまな計画領域にわたってその有用性が明らかになりました。

要約(オリジナル)

This paper studies the problem of action model learning with full observability. Following the learning by search paradigm by Mitchell, we develop a theory for action model learning based on version spaces that interprets the task as search for hypothesis that are consistent with the learning examples. Our theoretical findings are instantiated in an online algorithm that maintains a compact representation of all solutions of the problem. Among these range of solutions, we bring attention to actions models approximating the actual transition system from below (sound models) and from above (complete models). We show how to manipulate the output of our learning algorithm to build deterministic and non-deterministic formulations of the sound and complete models and prove that, given enough examples, both formulations converge into the very same true model. Our experiments reveal their usefulness over a range of planning domains.

arxiv情報

著者 Diego Aineto,Enrico Scala
発行日 2024-04-15 10:01:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク