-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「math.OC」カテゴリーアーカイブ
Don’t be so Monotone: Relaxing Stochastic Line Search in Over-Parameterized Models
要約 最近の研究では、現代の過剰パラメータ化設定において、ライン探索法が確率的勾 … 続きを読む
Saddle-to-Saddle Dynamics in Diagonal Linear Networks
要約 この論文では、消失初期化の極限における対角線形ネットワーク上の勾配流の軌跡 … 続きを読む
(S)GD over Diagonal Linear Networks: Implicit Regularisation, Large Stepsizes and Edge of Stability
要約 この論文では、対角線形ネットワーク上の勾配降下法 (GD) と確率的勾配降 … 続きを読む
Maximize to Explore: One Objective Function Fusing Estimation, Planning, and Exploration
要約 オンライン強化学習 (オンライン RL) では、サンプル効率の高い方法で最 … 続きを読む
How to Train Your Neural Control Barrier Function: Learning Safety Filters for Complex Input-Constrained Systems
要約 コントロール バリア関数 (CBF) は、任意の入力に対する非線形動的シス … 続きを読む
Convergence of Sign-based Random Reshuffling Algorithms for Nonconvex Optimization
要約 SignSGD は、通信効率が高いため、非凸最適化で人気があります。 しか … 続きを読む
Stable Nonconvex-Nonconcave Training via Linear Interpolation
要約 この論文では、(大規模な) ニューラル ネットワーク トレーニングを安定化 … 続きを読む
Demystifying the Myths and Legends of Nonconvex Convergence of SGD
要約 確率的勾配降下法 (SGD) とそのバリアントは、非凸目的関数を使用した大 … 続きを読む
Policy Optimization for Continuous Reinforcement Learning
要約 私たちは、連続した時間と空間の設定で、割引された目的と確率的微分方程式によ … 続きを読む