要約
物理学や工学における多くの現象は形式的には高次元ですが、その長期的な力学は低次元の多様体上に存在することがよくあります。
現在の研究では、内部線形層による暗黙的な正則化と $L_2$ 正則化 (重み減衰) を組み合わせたオートエンコーダ フレームワークを導入して、データセットの基礎となる次元を自動的に推定し、直交多様体座標系を生成し、アンビエント間のマッピング関数を提供します。
空間と多様体空間を統合し、サンプル外の投影を可能にします。
さまざまな複雑さの動的システムから一連のデータセットの多様体次元を推定し、他の最先端の推定器と比較するフレームワークの能力を検証します。
私たちは、ネットワークのトレーニング ダイナミクスを分析して、低ランク学習のメカニズムについての洞察を収集し、暗黙的な正則化層のそれぞれが集合的に低ランク表現を複合化し、トレーニング中に自己修正することさえあることを発見しました。
線形の場合におけるこのアーキテクチャの勾配降下ダイナミクスの分析により、すべての層を組み込んだ「集合的な重み変数」のより速い減衰を引き起こす内部線形層の役割と、縮退を打破して収束を促進する際の重み減衰の役割が明らかになります。
それが存在しない場合には崩壊は起こらないであろう方向。
我々は、多様体座標のみを使用して時空間カオス偏微分方程式のデータ駆動型動的モデルを生成することにより、このフレームワークを状態空間モデリングと予測のアプリケーションに自然に拡張できることを示します。
最後に、私たちのフレームワークがハイパーパラメーターの選択に対して堅牢であることを示します。
要約(オリジナル)
While many phenomena in physics and engineering are formally high-dimensional, their long-time dynamics often live on a lower-dimensional manifold. The present work introduces an autoencoder framework that combines implicit regularization with internal linear layers and $L_2$ regularization (weight decay) to automatically estimate the underlying dimensionality of a data set, produce an orthogonal manifold coordinate system, and provide the mapping functions between the ambient space and manifold space, allowing for out-of-sample projections. We validate our framework’s ability to estimate the manifold dimension for a series of datasets from dynamical systems of varying complexities and compare to other state-of-the-art estimators. We analyze the training dynamics of the network to glean insight into the mechanism of low-rank learning and find that collectively each of the implicit regularizing layers compound the low-rank representation and even self-correct during training. Analysis of gradient descent dynamics for this architecture in the linear case reveals the role of the internal linear layers in leading to faster decay of a ‘collective weight variable’ incorporating all layers, and the role of weight decay in breaking degeneracies and thus driving convergence along directions in which no decay would occur in its absence. We show that this framework can be naturally extended for applications of state-space modeling and forecasting by generating a data-driven dynamic model of a spatiotemporally chaotic partial differential equation using only the manifold coordinates. Finally, we demonstrate that our framework is robust to hyperparameter choices.
arxiv情報
著者 | Kevin Zeng,Carlos E. Pérez De Jesús,Andrew J. Fox,Michael D. Graham |
発行日 | 2023-12-06 16:23:35+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google