
From Empirical Observations to Universality: Dynamics of Deep Learning with Inputs Built on Gaussian mixture

要約 この研究は、混合ガウス (GM) への構造的特性を示す入力を使用してニュー … 続きを読む

カテゴリー: cond-mat.dis-nn, cond-mat.stat-mech, cs.LG, stat.ML | From Empirical Observations to Universality: Dynamics of Deep Learning with Inputs Built on Gaussian mixture はコメントを受け付けていません

KAN: Kolmogorov-Arnold Networks

要約 コルモゴロフ-アーノルド表現定理に触発されて、私たちは多層パーセプトロン … 続きを読む

カテゴリー: cond-mat.dis-nn, cs.AI, cs.LG, stat.ML | KAN: Kolmogorov-Arnold Networks はコメントを受け付けていません

An exactly solvable model for emergence and scaling laws

要約 深層学習モデルは、トレーニング時間 ($T$)、トレーニング データ ($ … 続きを読む

カテゴリー: cond-mat.dis-nn, cs.LG, stat.ML | An exactly solvable model for emergence and scaling laws はコメントを受け付けていません

How Deep Networks Learn Sparse and Hierarchical Data: the Sparse Random Hierarchy Model

要約 高次元データを学習可能にするものを理解することは、機械学習における基本的な … 続きを読む

カテゴリー: cond-mat.dis-nn, cs.LG, stat.ML | How Deep Networks Learn Sparse and Hierarchical Data: the Sparse Random Hierarchy Model はコメントを受け付けていません

A replica analysis of under-bagging

要約 不均衡なデータから分類器をトレーニングするための一般的なアンサンブル学習方 … 続きを読む

カテゴリー: cond-mat.dis-nn, cond-mat.stat-mech, cs.LG, stat.ML | A replica analysis of under-bagging はコメントを受け付けていません

Rotation-equivariant Graph Neural Networks for Learning Glassy Liquids Representations

要約 ガラス状液体の静的構造とそのダイナミクスを関連付けるという難しい問題は、デ … 続きを読む

カテゴリー: cond-mat.dis-nn, cond-mat.soft, cs.LG | Rotation-equivariant Graph Neural Networks for Learning Glassy Liquids Representations はコメントを受け付けていません

A Dynamical Model of Neural Scaling Laws

要約 さまざまなタスクにおいて、ニューラル ネットワークのパフォーマンスは、トレ … 続きを読む

カテゴリー: cond-mat.dis-nn, cs.LG, stat.ML | A Dynamical Model of Neural Scaling Laws はコメントを受け付けていません

Grokking as the Transition from Lazy to Rich Training Dynamics

要約 私たちは、ニューラル ネットワークのトレーニング損失がテスト損失よりもはる … 続きを読む

カテゴリー: cond-mat.dis-nn, cs.LG, stat.ML | Grokking as the Transition from Lazy to Rich Training Dynamics はコメントを受け付けていません

Neural population geometry and optimal coding of tasks with shared latent structure

要約 人間と動物は環境内の潜在的な構造を認識し、その情報を適用して世界を効率的に … 続きを読む

カテゴリー: cond-mat.dis-nn, cond-mat.stat-mech, cs.LG, cs.NE, q-bio.NC | Neural population geometry and optimal coding of tasks with shared latent structure はコメントを受け付けていません

Mapping of attention mechanisms to a generalized Potts model

要約 トランスフォーマーは、自然言語処理と機械学習に革命をもたらしたニューラルネ … 続きを読む

カテゴリー: cond-mat.dis-nn, cond-mat.stat-mech, cs.CL, stat.ML | Mapping of attention mechanisms to a generalized Potts model はコメントを受け付けていません