Habits of Mind: Reusing Action Sequences for Efficient Planning

要約

一連のアクションを実行すると、その実行がより流暢かつ正確になります。
ここでは、過去に頻繁に使用されたパスに焦点を当てて探索ツリーを拡張し、複数の方法を介して深い計画の問題を浅い問題に削減することによって、演習されたアクションシーケンスを計画の高速化と正確化にも使用できる可能性を検討します。
-ステップは木の中でジャンプします。
このようなシーケンスを捕捉するために、さまざまなスケールで統計的に信頼できる構造を見つけて活用する、柔軟なベイジアン アクション チャンキング メカニズムを使用します。
これにより、モンテカルロ ツリー検索プランナーに埋め込むことができる、より短いルーチンまたはより長いルーチンが生成されます。
タングラムに倣ってパターン化された物理的な構築タスクを使用して、このスキームの利点を示します。

要約(オリジナル)

When we exercise sequences of actions, their execution becomes more fluent and precise. Here, we consider the possibility that exercised action sequences can also be used to make planning faster and more accurate by focusing expansion of the search tree on paths that have been frequently used in the past, and by reducing deep planning problems to shallow ones via multi-step jumps in the tree. To capture such sequences, we use a flexible Bayesian action chunking mechanism which finds and exploits statistically reliable structure at different scales. This gives rise to shorter or longer routines that can be embedded into a Monte-Carlo tree search planner. We show the benefits of this scheme using a physical construction task patterned after tangrams.

arxiv情報

著者 Noémi Éltető,Peter Dayan
発行日 2023-06-08 15:42:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク