-
最近の投稿
- Computing High-dimensional Confidence Sets for Arbitrary Distributions
- Reservoir Computing: A New Paradigm for Neural Networks
- A Dynamic, Ordinal Gaussian Process Item Response Theoretic Model
- Solving the Paint Shop Problem with Flexible Management of Multi-Lane Buffers Using Reinforcement Learning and Action Masking
- MiLo: Efficient Quantized MoE Inference with Mixture of Low-Rank Compensators
-
最近のコメント
表示できるコメントはありません。 cs.AI (36107) cs.CL (27319) cs.CR (2749) cs.CV (41949) cs.LG (41080) cs.RO (21304) cs.SY (3219) eess.IV (4921) eess.SY (3213) stat.ML (5380)
「60G10 (Primary) 62M20」カテゴリーアーカイブ
A Simplistic Model of Neural Scaling Laws: Multiperiodic Santa Fe Processes
要約 大規模な言語モデルは、パラメーターとトレーニング トークンの数に関して、ク … 続きを読む
カテゴリー: 60G10 (Primary) 62M20, 94A17 (Secondary), cs.IT, cs.LG, math.IT, math.ST, stat.TH
A Simplistic Model of Neural Scaling Laws: Multiperiodic Santa Fe Processes はコメントを受け付けていません