94A17 (Secondary)」カテゴリーアーカイブ

A Simplistic Model of Neural Scaling Laws: Multiperiodic Santa Fe Processes

要約 大規模な言語モデルは、パラメーターとトレーニング トークンの数に関して、ク … 続きを読む

カテゴリー: 60G10 (Primary) 62M20, 94A17 (Secondary), cs.IT, cs.LG, math.IT, math.ST, stat.TH | A Simplistic Model of Neural Scaling Laws: Multiperiodic Santa Fe Processes はコメントを受け付けていません