要約
この論文では、離散時間における能動推論の簡潔な数学的説明を示します。
論文の主要部分は、アクション選択の理論を説明する詳細な例を含む、このトピックの基本的な紹介として機能します。
付録では、より微妙な数学的詳細について説明します。
この部分は、すでに能動的推論の文献を学習しているものの、数学的な詳細や導出を理解するのに苦労している読者を対象としています。
原稿全体を通じて、正確かつ標準的な数学テキストに沿った表記を採用することに特別な注意が払われました。
すべての方程式と導出は、このトピックに関する他の一般的なテキストの特定の方程式番号にリンクされています。
さらに、この文書で説明されているアクション選択メカニズムを実装し、pymdp 環境と互換性のある Python コードが提供されます。
要約(オリジナル)
In this paper we present a concise mathematical description of active inference in discrete time. The main part of the paper serves as a basic introduction to the topic, including a detailed example illustrating the theory on action selection. In the appendix the more subtle mathematical details are discussed. This part is aimed at readers who have already studied the active inference literature but struggle to make sense of the mathematical details and derivations. Throughout the whole manuscript, special attention has been paid to adopting notation that is both precise and in line with standard mathematical texts. All equations and derivations are linked to specific equation numbers in other popular text on the topic. Furthermore, Python code is provided that implements the action selection mechanism described in this paper and is compatible with pymdp environments.
arxiv情報
著者 | Jesse van Oostrum,Carlotta Langer,Nihat Ay |
発行日 | 2024-09-25 17:59:18+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google