15B52」カテゴリーアーカイブ

Analysis of an Idealized Stochastic Polyak Method and its Application to Black-Box Model Distillation

要約 SPS $^*$と呼ばれる理想的な確率的ポリックステップサイズの一般的な収 … 続きを読む

カテゴリー: 15B52, 62L20, 65Y20, 68W20, 68W40, 74S60, 90C06, 90C53, cs.LG, G.1.6 | Analysis of an Idealized Stochastic Polyak Method and its Application to Black-Box Model Distillation はコメントを受け付けていません

Global law of conjugate kernel random matrices with heavy-tailed weights

要約 コンジュゲートカーネルランダムマトリックス$ yy^\ top $の漸近ス … 続きを読む

カテゴリー: 15B52, 60B20, 68T07, cs.LG, math.PR, stat.ML | Global law of conjugate kernel random matrices with heavy-tailed weights はコメントを受け付けていません

MoMo: Momentum Models for Adaptive Learning Rates

要約 我々は、どのような運動量法でも使用できる新しい適応的な学習率を提示する。こ … 続きを読む

カテゴリー: 15B52, 62L20, 65Y20, 68W20, 68W40, 74S60, 90C06, 90C53, cs.LG, G.1.6, math.OC | MoMo: Momentum Models for Adaptive Learning Rates はコメントを受け付けていません