-
最近の投稿
- Efficiently Generating Expressive Quadruped Behaviors via Language-Guided Preference Learning
- Whole-Body Dynamic Throwing with Legged Manipulators
- RG-Attn: Radian Glue Attention for Multi-modality Multi-agent Cooperative Perception
- Scalable Real2Sim: Physics-Aware Asset Generation Via Robotic Pick-and-Place Setups
- Temporal and Semantic Evaluation Metrics for Foundation Models in Post-Hoc Analysis of Robotic Sub-tasks
-
最近のコメント
表示できるコメントはありません。 cs.AI (35979) cs.CL (27216) cs.CR (2743) cs.CV (41827) cs.LG (40948) cs.RO (21216) cs.SY (3206) eess.IV (4914) eess.SY (3200) stat.ML (5368)
「62L20」カテゴリーアーカイブ
Nonasymptotic Analysis of Stochastic Gradient Descent with the Richardson-Romberg Extrapolation
要約 本論文では、一定のステップサイズを持つ確率的勾配降下(SGD)アルゴリズム … 続きを読む
Gaussian Approximation and Multiplier Bootstrap for Stochastic Gradient Descent
要約 この論文では、確率的勾配降下(SGD)のPolyAK-Ruppert平均繰 … 続きを読む
Upper Bounds for Learning in Reproducing Kernel Hilbert Spaces for Non IID Samples
要約 この論文では、二次損失関数の最適解を近似することを目的として、一般的なヒル … 続きを読む
Improving the Convergence Rates of Forward Gradient Descent with Repeated Sampling
要約 前方勾配降下法 (FGD) は、後方パスなしで計算できるため、生物学的に最 … 続きを読む
The ODE Method for Asymptotic Statistics in Stochastic Approximation and Reinforcement Learning
要約 この論文は $d$ 次元の確率的近似再帰 $$ \theta_{n+1}= … 続きを読む
The ODE Method for Asymptotic Statistics in Stochastic Approximation and Reinforcement Learning
要約 この論文は、確率的近似再帰 \[ \theta_{n+1}= \theta … 続きを読む
Convergence of stochastic gradient descent schemes for Lojasiewicz-landscapes
要約 この記事では、基礎となる状況に関する弱い仮定の下で、運動量確率的勾配降下法 … 続きを読む
Convergence Rates for Stochastic Approximation: Biased Noise with Unbounded Variance, and Applications
要約 1951 年に Robbins と Monro によって導入された確率的近 … 続きを読む
Stability of Q-Learning Through Design and Optimism
要約 Q ラーニングは、1980 年代に Chris Watkins の論文で導 … 続きを読む
Almost-sure convergence of iterates and multipliers in stochastic sequential quadratic optimization
要約 非線形等式制約を伴う連続最適化問題を解くための確率的逐次二次最適化 (SQ … 続きを読む