「93E35」カテゴリーアーカイブ

Nonasymptotic Analysis of Stochastic Gradient Descent with the Richardson-Romberg Extrapolation

投稿日: 2025年3月4日作成者: jarxiv

要約本論文では、一定のステップサイズを持つ確率的勾配降下(SGD)アルゴリズム … 続きを読む →

カテゴリー: 62L20, 93E35, cs.LG, math.OC, stat.ML | コメントを受け付けていません

投稿日: 2025年2月11日作成者: jarxiv

要約この論文では、確率的勾配降下（SGD）のPolyAK-Ruppert平均繰 … 続きを読む →

カテゴリー: 60F05, 62L20, 93E35, cs.LG, math.OC, math.PR, math.ST, stat.ML, stat.TH | コメントを受け付けていません

投稿日: 2024年12月16日作成者: jarxiv

要約サービスシステム内のアプリケーションを動機として、適切なスキルセットを … 続きを読む →

カテゴリー: 60K25, 90C27, 93E35, cs.LG, math.PR | コメントを受け付けていません

投稿日: 2024年10月24日作成者: jarxiv

要約 POMDP での学習は、MDP よりもはるかに難しいことが知られています。 … 続きを読む →

カテゴリー: 93E35, cs.AI, cs.LG, cs.SY, eess.SY, stat.ML | コメントを受け付けていません

投稿日: 2023年8月22日作成者: jarxiv

要約 Q ラーニングは、1980 年代に Chris Watkins の論文で導 … 続きを読む →

カテゴリー: 62L20, 68T05, 93E20, 93E35, cs.LG, cs.SY, eess.SY, math.OC | コメントを受け付けていません