要約
この論文では、障害、初期状態、設定された目標に関係なく、実行すると、カテゴリー内のすべての計画問題を解決することが保証される、普遍的な計画の概念を紹介します。
このような計画は、センサーからのフィードバックなしで盲目的に適用される一連の決定的なアクションとして指定されます。
したがって、それらは強化学習のコンテキストにおける純粋な探索と考えることができ、基本的なメモリ要件があれば、最適な計画さえも生成できることを示します。
数論とオートマトン理論の結果に基づいて、離散的および連続的 (運動) 計画の両方に普遍的な計画を提供し、その (半) 完全性を証明します。
概念はシミュレーション研究を通じて適用および説明され、将来の研究のいくつかの方向性が描かれます。
要約(オリジナル)
This paper introduces the notion of a universal plan, which when executed, is guaranteed to solve all planning problems in a category, regardless of the obstacles, initial state, and goal set. Such plans are specified as a deterministic sequence of actions that are blindly applied without any sensor feedback. Thus, they can be considered as pure exploration in a reinforcement learning context, and we show that with basic memory requirements, they even yield optimal plans. Building upon results in number theory and theory of automata, we provide universal plans both for discrete and continuous (motion) planning and prove their (semi)completeness. The concepts are applied and illustrated through simulation studies, and several directions for future research are sketched.
arxiv情報
著者 | Kalle G. Timperi,Alexander J. LaValle,Steven M. LaValle |
発行日 | 2024-09-16 10:45:29+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google