From NeurODEs to AutoencODEs: a mean-field control framework for width-varying Neural Networks


私たちの研究では、Residual Neural Networks (ResNets) と NeurODE として知られる連続時間制御システムの間に確立された接続を構築しています。
NeurODE は構造上、一定幅の層に制限されているため、幅が変化する層を含む深層学習アーキテクチャのモデリングには適していません。
この論文では、AutoencODE と呼ばれる連続時間オートエンコーダを提案し、通常の NeurODE 用にすでに開発されている平均場制御フレームワークをこのケースに拡張します。


In our work, we build upon the established connection between Residual Neural Networks (ResNets) and continuous-time control systems known as NeurODEs. By construction, NeurODEs have been limited to constant-width layers, making them unsuitable for modeling deep learning architectures with width-varying layers. In this paper, we propose a continuous-time Autoencoder, which we call AutoencODE, and we extend to this case the mean-field control framework already developed for usual NeurODEs. In this setting, we tackle the case of low Tikhonov regularization, resulting in potentially non-convex cost landscapes. While the global results obtained for high Tikhonov regularization may not hold globally, we show that many of them can be recovered in regions where the loss function is locally convex. Inspired by our theoretical findings, we develop a training method tailored to this specific type of Autoencoders with residual connections, and we validate our approach through numerical experiments conducted on various examples.


著者 Cristina Cipriani,Massimo Fornasier,Alessandro Scagliotti
発行日 2023-07-05 13:26:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.LG, cs.SY, eess.SY, math.OC パーマリンク