-
最近の投稿
- Finding Minimum-Cost Explanations for Predictions made by Tree Ensembles
- Supervised learning with probabilistic morphisms and kernel mean embeddings
- A Bayesian approach to modeling topic-metadata relationships
- APEX-MR: Multi-Robot Asynchronous Planning and Execution for Cooperative Assembly
- An End-to-End Framework for Optimizing Foot Trajectory and Force in Dry Adhesion Legged Wall-Climbing Robots
-
最近のコメント
表示できるコメントはありません。 cs.AI (37255) cs.CL (28190) cs.CV (42957) cs.HC (2847) cs.LG (42192) cs.RO (22087) cs.SY (3373) eess.IV (5001) eess.SY (3365) stat.ML (5517)
「94A17 (Secondary)」カテゴリーアーカイブ
A Simplistic Model of Neural Scaling Laws: Multiperiodic Santa Fe Processes
要約 大規模な言語モデルは、パラメーターとトレーニング トークンの数に関して、ク … 続きを読む
カテゴリー: 60G10 (Primary) 62M20, 94A17 (Secondary), cs.IT, cs.LG, math.IT, math.ST, stat.TH
A Simplistic Model of Neural Scaling Laws: Multiperiodic Santa Fe Processes はコメントを受け付けていません