-
最近の投稿
- Scaling Policy Gradient Quality-Diversity with Massive Parallelization via Behavioral Variations
- Integrating LMM Planners and 3D Skill Policies for Generalizable Manipulation
- Clarke Transform and Encoder-Decoder Architecture for Arbitrary Joints Locations in Displacement-Actuated Continuum Robots
- One Stack, Diverse Vehicles: Checking Safe Portability of Automated Driving Software
- Designing Kresling Origami for Personalised Wrist Orthosis
-
最近のコメント
表示できるコメントはありません。 cs.AI (33060) cs.CL (24993) cs.CR (2556) cs.CV (39181) cs.LG (37978) cs.RO (19224) cs.SY (2943) eess.IV (4695) eess.SY (2937) stat.ML (4995)
「94A17 (Secondary)」カテゴリーアーカイブ
A Simplistic Model of Neural Scaling Laws: Multiperiodic Santa Fe Processes
要約 大規模な言語モデルは、パラメーターとトレーニング トークンの数に関して、ク … 続きを読む
カテゴリー: 60G10 (Primary) 62M20, 94A17 (Secondary), cs.IT, cs.LG, math.IT, math.ST, stat.TH
A Simplistic Model of Neural Scaling Laws: Multiperiodic Santa Fe Processes はコメントを受け付けていません