Universal Plans: One Action Sequence to Solve Them All!

要約

この論文では、障害、初期状態、設定された目標に関係なく、実行すると、カテゴリー内のすべての計画問題を解決することが保証される、普遍的な計画の概念を紹介します。
このような計画は、センサーからのフィードバックなしで盲目的に適用される一連の決定的なアクションとして指定されます。
したがって、これらは強化学習のコンテキストにおける純粋な探索と考えることができ、基本的なメモリ要件があれば、漸近的に最適な計画も生成されることを示します。
数論とオートマトン理論の結果に基づいて、離散的および連続的 (運動) 計画の両方に普遍的な計画を提供し、その (半) 完全性を証明します。
概念はシミュレーション研究を通じて適用および説明され、将来の研究のいくつかの方向性が描かれます。

要約(オリジナル)

This paper introduces the notion of a universal plan, which when executed, is guaranteed to solve all planning problems in a category, regardless of the obstacles, initial state, and goal set. Such plans are specified as a deterministic sequence of actions that are blindly applied without any sensor feedback. Thus, they can be considered as pure exploration in a reinforcement learning context, and we show that with basic memory requirements, they even yield asymptotically optimal plans. Building upon results in number theory and theory of automata, we provide universal plans both for discrete and continuous (motion) planning and prove their (semi)completeness. The concepts are applied and illustrated through simulation studies, and several directions for future research are sketched.

arxiv情報

著者 Kalle G. Timperi,Alexander J. LaValle,Steven M. LaValle
発行日 2024-07-02 09:26:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: (Primary), 51-08, cs.RO, F.1.1, math.CO, math.NT, secondary パーマリンク