-
最近の投稿
- FaVoR: Features via Voxel Rendering for Camera Relocalization
- Learning Reward and Policy Jointly from Demonstration and Preference Improves Alignment
- Continual Learning and Lifting of Koopman Dynamics for Linear Control of Legged Robots
- InterHub: A Naturalistic Trajectory Dataset with Dense Interaction for Autonomous Driving
- Nl2Hltl2Plan: Scaling Up Natural Language Understanding for Multi-Robots Through Hierarchical Temporal Logic Task Representation
-
最近のコメント
表示できるコメントはありません。 cs.AI (30383) cs.CL (22961) cs.CR (2361) cs.CV (36763) cs.LG (35252) cs.RO (17684) cs.SY (2715) eess.IV (4466) eess.SY (2709) stat.ML (4693)
「62L20」カテゴリーアーカイブ
Improving the Convergence Rates of Forward Gradient Descent with Repeated Sampling
要約 前方勾配降下法 (FGD) は、後方パスなしで計算できるため、生物学的に最 … 続きを読む
The ODE Method for Asymptotic Statistics in Stochastic Approximation and Reinforcement Learning
要約 この論文は $d$ 次元の確率的近似再帰 $$ \theta_{n+1}= … 続きを読む
The ODE Method for Asymptotic Statistics in Stochastic Approximation and Reinforcement Learning
要約 この論文は、確率的近似再帰 \[ \theta_{n+1}= \theta … 続きを読む
Convergence of stochastic gradient descent schemes for Lojasiewicz-landscapes
要約 この記事では、基礎となる状況に関する弱い仮定の下で、運動量確率的勾配降下法 … 続きを読む
Convergence Rates for Stochastic Approximation: Biased Noise with Unbounded Variance, and Applications
要約 1951 年に Robbins と Monro によって導入された確率的近 … 続きを読む
Stability of Q-Learning Through Design and Optimism
要約 Q ラーニングは、1980 年代に Chris Watkins の論文で導 … 続きを読む
Almost-sure convergence of iterates and multipliers in stochastic sequential quadratic optimization
要約 非線形等式制約を伴う連続最適化問題を解くための確率的逐次二次最適化 (SQ … 続きを読む