Neo-FREE: Policy Composition Through Thousand Brains And Free Energy Optimization

要約

制御タスクに取り組むためにプリミティブのセットを最適に構成する問題を検討します。
この問題に対処するために、認知科学の千の頭脳理論と自由エネルギー原理に触発された制御アーキテクチャである Neo-FREE を導入します。
千脳理論によって仮定された新皮質 (Neo) プロセスに従って、Neo-FREE は制御プリミティブを返す機能単位で構成されます。
これらは、変分自由エネルギー (FREE) を最小限に抑えるゲート機構によって線形に結合されます。
最適なプリミティブの重みを見つける問題は、有限水平最適制御問題として再構成されます。これは、コストがなく、環境が非線形、確率的、非定常である場合でも凸になります。
その結果、プリミティブ合成のアルゴリズムが得られ、Neo-FREE の有効性が、障害物のある環境でのロボット ナビゲーションを含むアプリケーションのインシリコ実験とハードウェア実験によって示されます。

要約(オリジナル)

We consider the problem of optimally composing a set of primitives to tackle control tasks. To address this problem, we introduce Neo-FREE: a control architecture inspired by the Thousand Brains Theory and Free Energy Principle from cognitive sciences. In accordance with the neocortical (Neo) processes postulated by the Thousand Brains Theory, Neo-FREE consists of functional units returning control primitives. These are linearly combined by a gating mechanism that minimizes the variational free energy (FREE). The problem of finding the optimal primitives’ weights is then recast as a finite-horizon optimal control problem, which is convex even when the cost is not and the environment is nonlinear, stochastic, non-stationary. The results yield an algorithm for primitives composition and the effectiveness of Neo-FREE is illustrated via in-silico and hardware experiments on an application involving robot navigation in an environment with obstacles.

arxiv情報

著者 Francesca Rossi,Émiland Garrabé,Giovanni Russo
発行日 2024-12-09 16:28:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY, math.OC パーマリンク