62L20」カテゴリーアーカイブ

The ODE Method for Asymptotic Statistics in Stochastic Approximation and Reinforcement Learning

要約 この論文は、確率的近似再帰 \[ \theta_{n+1}= \theta … 続きを読む

カテゴリー: 60F17, 62L20, 68T05, cs.LG, math.ST, stat.TH | The ODE Method for Asymptotic Statistics in Stochastic Approximation and Reinforcement Learning はコメントを受け付けていません

Convergence of stochastic gradient descent schemes for Lojasiewicz-landscapes

要約 この記事では、基礎となる状況に関する弱い仮定の下で、運動量確率的勾配降下法 … 続きを読む

カテゴリー: 60J20, 62L20, 65C05, cs.LG, math.PR, math.ST, stat.TH | Convergence of stochastic gradient descent schemes for Lojasiewicz-landscapes はコメントを受け付けていません

Convergence Rates for Stochastic Approximation: Biased Noise with Unbounded Variance, and Applications

要約 1951 年に Robbins と Monro によって導入された確率的近 … 続きを読む

カテゴリー: 60G17, 62L20, 93D05, cs.LG, math.OC, math.PR, stat.ML | Convergence Rates for Stochastic Approximation: Biased Noise with Unbounded Variance, and Applications はコメントを受け付けていません

Stability of Q-Learning Through Design and Optimism

要約 Q ラーニングは、1980 年代に Chris Watkins の論文で導 … 続きを読む

カテゴリー: 62L20, 68T05, 93E20, 93E35, cs.LG, cs.SY, eess.SY, math.OC | Stability of Q-Learning Through Design and Optimism はコメントを受け付けていません

Almost-sure convergence of iterates and multipliers in stochastic sequential quadratic optimization

要約 非線形等式制約を伴う連続最適化問題を解くための確率的逐次二次最適化 (SQ … 続きを読む

カテゴリー: 49M05, 49M37, 62L20, 65K05, 68W20, 90C26, 90C30, 90C55, cs.LG, math.OC | Almost-sure convergence of iterates and multipliers in stochastic sequential quadratic optimization はコメントを受け付けていません

MoMo: Momentum Models for Adaptive Learning Rates

要約 我々は、どのような運動量法でも使用できる新しい適応的な学習率を提示する。こ … 続きを読む

カテゴリー: 15B52, 62L20, 65Y20, 68W20, 68W40, 74S60, 90C06, 90C53, cs.LG, G.1.6, math.OC | MoMo: Momentum Models for Adaptive Learning Rates はコメントを受け付けていません