要約
遷移モデルが決定論的で既知である場合でも、継続的な状態およびアクションスペースでの効率的な計画は根本的に困難です。
この課題を緩和する1つの方法は、抽象化を使用して抽象的な計画を実行することで、抽象計画の高レベルの検索を使用して、元の移行スペースで計画を導くことです。
以前の研究では、象徴的な述語の形での状態抽象化が手描きである場合、デモからバイレベル計画のためのオペレーターとサンプラーを学ぶことができることが示されています。
この作業では、デモンストレーションから述語を学習するためのアルゴリズムを提案し、手動で指定された状態抽象化の必要性を排除します。
私たちの重要なアイデアは、私たちの真の効率的な計画目標に忠実であるが忠実な代理目標を最適化することにより、述語を学ぶことです。
この代理目標を、文法から描かれた述語セットを介した丘の登り検索で使用します。
実験的に、4つのロボット計画環境にわたって、学習した抽象化が、6つのベースラインを上回る保留アウトタスクを迅速に解決できることを示しています。
コード:https://tinyurl.com/predicators-release
要約(オリジナル)
Efficient planning in continuous state and action spaces is fundamentally hard, even when the transition model is deterministic and known. One way to alleviate this challenge is to perform bilevel planning with abstractions, where a high-level search for abstract plans is used to guide planning in the original transition space. Previous work has shown that when state abstractions in the form of symbolic predicates are hand-designed, operators and samplers for bilevel planning can be learned from demonstrations. In this work, we propose an algorithm for learning predicates from demonstrations, eliminating the need for manually specified state abstractions. Our key idea is to learn predicates by optimizing a surrogate objective that is tractable but faithful to our real efficient-planning objective. We use this surrogate objective in a hill-climbing search over predicate sets drawn from a grammar. Experimentally, we show across four robotic planning environments that our learned abstractions are able to quickly solve held-out tasks, outperforming six baselines. Code: https://tinyurl.com/predicators-release
arxiv情報
著者 | Tom Silver,Rohan Chitnis,Nishanth Kumar,Willie McClinton,Tomas Lozano-Perez,Leslie Pack Kaelbling,Joshua Tenenbaum |
発行日 | 2025-05-27 13:09:33+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google