-
最近の投稿
- Online Adaptation of Terrain-Aware Dynamics for Planning in Unstructured Environments
- ‘Don’t Do That!’: Guiding Embodied Systems through Large Language Model-based Constraint Generation
- SGN-CIRL: Scene Graph-based Navigation with Curriculum, Imitation, and Reinforcement Learning
- Olfactory Inertial Odometry: Sensor Calibration and Drift Compensation
- Chronoamperometry with Room-Temperature Ionic Liquids: Sub-Second Inference Techniques
-
最近のコメント
表示できるコメントはありません。 cs.AI (39257) cs.CL (29715) cs.CV (44646) cs.HC (2989) cs.LG (44171) cs.RO (23444) cs.SY (3577) eess.IV (5131) eess.SY (3569) stat.ML (5743)
「93E35」カテゴリーアーカイブ
Nonasymptotic Analysis of Stochastic Gradient Descent with the Richardson-Romberg Extrapolation
要約 本論文では、一定のステップサイズを持つ確率的勾配降下(SGD)アルゴリズム … 続きを読む
Gaussian Approximation and Multiplier Bootstrap for Stochastic Gradient Descent
要約 この論文では、確率的勾配降下(SGD)のPolyAK-Ruppert平均繰 … 続きを読む
Learning payoffs while routing in skill-based queues
要約 サービス システム内のアプリケーションを動機として、適切なスキル セットを … 続きを読む
Posterior Sampling-based Online Learning for Episodic POMDPs
要約 POMDP での学習は、MDP よりもはるかに難しいことが知られています。 … 続きを読む