Understanding Predictive Coding as an Adaptive Trust-Region Method

要約

予測コーディング (PC) は、脳にインスピレーションを得た局所学習アルゴリズムで、生物学的に関連するシナリオにおいてバックプロパゲーション (BP) よりも優れていることが最近示唆されています。
理論的な研究は主に、PC がさまざまな制限内で血圧をどのように近似できるかを示すことに焦点を当ててきましたが、「自然な」PC の推定上の利点はあまり理解されていません。
ここでは、二次情報を使用する適応信頼領域 (TR) アルゴリズムとしての PC の理論を開発します。
PC の学習ダイナミクスは、BP の損失勾配方向と PC 推論ダイナミクスによって検出された TR 方向の間の補間として解釈できることを示します。
私たちの理論は、PC が BP よりも早く鞍点を脱出するはずであることを示唆しており、この予測は浅い線形モデルで証明され、より深いネットワークでの実験で裏付けられています。
この研究は、深くて広いネットワークにおける PC を理解するための基礎を築きます。

要約(オリジナル)

Predictive coding (PC) is a brain-inspired local learning algorithm that has recently been suggested to provide advantages over backpropagation (BP) in biologically relevant scenarios. While theoretical work has mainly focused on showing how PC can approximate BP in various limits, the putative benefits of ‘natural’ PC are less understood. Here we develop a theory of PC as an adaptive trust-region (TR) algorithm that uses second-order information. We show that the learning dynamics of PC can be interpreted as interpolating between BP’s loss gradient direction and a TR direction found by the PC inference dynamics. Our theory suggests that PC should escape saddle points faster than BP, a prediction which we prove in a shallow linear model and support with experiments on deeper networks. This work lays a foundation for understanding PC in deep and wide networks.

arxiv情報

著者 Francesco Innocenti,Ryan Singh,Christopher L. Buckley
発行日 2023-05-29 16:25:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.NE パーマリンク