74S60」カテゴリーアーカイブ

Analysis of an Idealized Stochastic Polyak Method and its Application to Black-Box Model Distillation

要約 SPS $^*$と呼ばれる理想的な確率的ポリックステップサイズの一般的な収 … 続きを読む

カテゴリー: 15B52, 62L20, 65Y20, 68W20, 68W40, 74S60, 90C06, 90C53, cs.LG, G.1.6 | Analysis of an Idealized Stochastic Polyak Method and its Application to Black-Box Model Distillation はコメントを受け付けていません

MoMo: Momentum Models for Adaptive Learning Rates

要約 我々は、どのような運動量法でも使用できる新しい適応的な学習率を提示する。こ … 続きを読む

カテゴリー: 15B52, 62L20, 65Y20, 68W20, 68W40, 74S60, 90C06, 90C53, cs.LG, G.1.6, math.OC | MoMo: Momentum Models for Adaptive Learning Rates はコメントを受け付けていません