要約
適応的な行動には、多くの場合、将来の出来事を予測することが必要です。
強化学習の理論は、どのような種類の予測表現が役立つのか、またそれらをどのように計算するのかを規定します。
この論文では、これらの理論的アイデアを認知および神経科学に関する研究と統合します。
我々は、エンジニアリングツールと脳機能モデルの両方として広く適用されている後継表現(SR)とその一般化に特に注意を払っています。
この収束は、特定の種類の予測表現が知能の多用途の構成要素として機能する可能性があることを示唆しています。
要約(オリジナル)
Adaptive behavior often requires predicting future events. The theory of reinforcement learning prescribes what kinds of predictive representations are useful and how to compute them. This paper integrates these theoretical ideas with work on cognition and neuroscience. We pay special attention to the successor representation (SR) and its generalizations, which have been widely applied both as engineering tools and models of brain function. This convergence suggests that particular kinds of predictive representations may function as versatile building blocks of intelligence.
arxiv情報
著者 | Wilka Carvalho,Momchil S. Tomov,William de Cothi,Caswell Barry,Samuel J. Gershman |
発行日 | 2024-02-09 18:10:38+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google