要約
タイトル:認知負荷が制限された状態でのベイジアン強化学習
要約:生物学的および人工的なエージェントは、情報処理能力に制限があるため学習し、意思決定をしなければならない。したがって、適応的な行動の一般理論は、エージェントの学習履歴、意思決定、キャパシティ制限の複雑な相互作用を説明できる必要がある。最近のコンピュータ科学の研究では、一貫した規範的なフレームワークとしての容量制限付きベイジアン強化学習の説明を提供し、強化学習、ベイジアン意思決定、レート・ディストーション理論のアイデアを結びつけた原則を明らかにし始めている。本稿では、この分野の最近のアルゴリズムや理論的結果を分かりやすく紹介し、認知科学や行動科学の研究にこれらのアイデアがどのように応用されるかに特に注目する。
– 生物学的および人工的なエージェントは、情報処理能力に制限があるため、学習し、意思決定をする必要がある。
– ベイジアン強化学習、ベイジアン意思決定、レート・ディストーション理論のアイデアを結びつけた原則は、容量制限付きベイジアン強化学習の説明を提供し始めている。
– 容量制限付きベイジアン強化学習は一貫した規範的なフレームワークを形成します。
– 本稿では、容量制限付きベイジアン強化学習の最近のアルゴリズムや理論的結果を紹介し、認知科学や行動科学の研究にこれらのアイデアがどのように応用されるかに特に注目する。
要約(オリジナル)
All biological and artificial agents must learn and make decisions given limits on their ability to process information. As such, a general theory of adaptive behavior should be able to account for the complex interactions between an agent’s learning history, decisions, and capacity constraints. Recent work in computer science has begun to clarify the principles that shape these dynamics by bridging ideas from reinforcement learning, Bayesian decision-making, and rate-distortion theory. This body of work provides an account of capacity-limited Bayesian reinforcement learning, a unifying normative framework for modeling the effect of processing constraints on learning and action selection. Here, we provide an accessible review of recent algorithms and theoretical results in this setting, paying special attention to how these ideas can be applied to studying questions in the cognitive and behavioral sciences.
arxiv情報
著者 | Dilip Arumugam,Mark K. Ho,Noah D. Goodman,Benjamin Van Roy |
発行日 | 2023-05-05 03:29:34+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI