「math.OC」カテゴリーアーカイブ

Don’t be so Monotone: Relaxing Stochastic Line Search in Over-Parameterized Models

投稿日: 2023年10月26日作成者: jarxiv

要約最近の研究では、現代の過剰パラメータ化設定において、ライン探索法が確率的勾 … 続きを読む →

カテゴリー: cs.LG, math.OC | コメントを受け付けていません

Saddle-to-Saddle Dynamics in Diagonal Linear Networks

投稿日: 2023年10月26日作成者: jarxiv

要約この論文では、消失初期化の極限における対角線形ネットワーク上の勾配流の軌跡 … 続きを読む →

カテゴリー: cs.LG, math.OC | コメントを受け付けていません

(S)GD over Diagonal Linear Networks: Implicit Regularisation, Large Stepsizes and Edge of Stability

投稿日: 2023年10月26日作成者: jarxiv

要約この論文では、対角線形ネットワーク上の勾配降下法 (GD) と確率的勾配降 … 続きを読む →

カテゴリー: cs.LG, math.OC, stat.ML | コメントを受け付けていません

Maximize to Explore: One Objective Function Fusing Estimation, Planning, and Exploration

投稿日: 2023年10月26日作成者: jarxiv

要約オンライン強化学習 (オンライン RL) では、サンプル効率の高い方法で最 … 続きを読む →

カテゴリー: cs.AI, cs.GT, cs.LG, math.OC, stat.ML | コメントを受け付けていません

How to Train Your Neural Control Barrier Function: Learning Safety Filters for Complex Input-Constrained Systems

投稿日: 2023年10月25日作成者: jarxiv

要約コントロールバリア関数 (CBF) は、任意の入力に対する非線形動的シス … 続きを読む →

カテゴリー: cs.RO, math.OC | コメントを受け付けていません

Convergence of Sign-based Random Reshuffling Algorithms for Nonconvex Optimization

投稿日: 2023年10月25日作成者: jarxiv

要約 SignSGD は、通信効率が高いため、非凸最適化で人気があります。しか … 続きを読む →

カテゴリー: cs.DC, cs.LG, math.OC, stat.ML | コメントを受け付けていません

Stable Nonconvex-Nonconcave Training via Linear Interpolation

投稿日: 2023年10月23日作成者: jarxiv

要約この論文では、(大規模な) ニューラルネットワークトレーニングを安定化 … 続きを読む →

カテゴリー: cs.LG, math.OC | コメントを受け付けていません

Demystifying the Myths and Legends of Nonconvex Convergence of SGD

投稿日: 2023年10月20日作成者: jarxiv

要約確率的勾配降下法 (SGD) とそのバリアントは、非凸目的関数を使用した大 … 続きを読む →

カテゴリー: cs.LG, cs.NA, math.NA, math.OC | コメントを受け付けていません

Policy Optimization for Continuous Reinforcement Learning

投稿日: 2023年10月19日作成者: jarxiv

要約私たちは、連続した時間と空間の設定で、割引された目的と確率的微分方程式によ … 続きを読む →

カテゴリー: cs.LG, math.OC | コメントを受け付けていません

Understanding Reward Ambiguity Through Optimal Transport Theory in Inverse Reinforcement Learning

投稿日: 2023年10月19日作成者: jarxiv

要約逆強化学習 (IRL) の中心的な目的は、特定のデータを説明するだけでなく … 続きを読む →

カテゴリー: cs.LG, cs.SY, eess.SY, math.OC | コメントを受け付けていません

「math.OC」カテゴリーアーカイブ

Don’t be so Monotone: Relaxing Stochastic Line Search in Over-Parameterized Models

Saddle-to-Saddle Dynamics in Diagonal Linear Networks

(S)GD over Diagonal Linear Networks: Implicit Regularisation, Large Stepsizes and Edge of Stability

Maximize to Explore: One Objective Function Fusing Estimation, Planning, and Exploration

How to Train Your Neural Control Barrier Function: Learning Safety Filters for Complex Input-Constrained Systems

Convergence of Sign-based Random Reshuffling Algorithms for Nonconvex Optimization

Stable Nonconvex-Nonconcave Training via Linear Interpolation

Demystifying the Myths and Legends of Nonconvex Convergence of SGD

Policy Optimization for Continuous Reinforcement Learning

Understanding Reward Ambiguity Through Optimal Transport Theory in Inverse Reinforcement Learning

最近の投稿

最近のコメント

アーカイブ

カテゴリー