math.OC」カテゴリーアーカイブ

Reusing Historical Trajectories in Natural Policy Gradient via Importance Sampling: Convergence and Convergence Rate

要約 強化学習は、学習ベースの制御のための数学的枠組みを提供します。その成功は、 … 続きを読む

カテゴリー: cs.LG, math.OC | Reusing Historical Trajectories in Natural Policy Gradient via Importance Sampling: Convergence and Convergence Rate はコメントを受け付けていません

Online Scheduling for LLM Inference with KV Cache Constraints

要約 トレーニングされたモデルがユーザープロンプトに応じて一度に1つの単語を生成 … 続きを読む

カテゴリー: cs.AI, cs.LG, math.OC | Online Scheduling for LLM Inference with KV Cache Constraints はコメントを受け付けていません

On Separation Between Best-Iterate, Random-Iterate, and Last-Iterate Convergence of Learning in Games

要約 ゲームにおける学習ダイナミクスの非エルゴディック収束は、理論と実践の両方に … 続きを読む

カテゴリー: cs.GT, cs.LG, math.OC | On Separation Between Best-Iterate, Random-Iterate, and Last-Iterate Convergence of Learning in Games はコメントを受け付けていません

On the Surprising Robustness of Sequential Convex Optimization for Contact-Implicit Motion Planning

要約 接触-暗示的運動計画-暗黙の相補性制約として接触順序を組み込む-は、新しい … 続きを読む

カテゴリー: cs.RO, math.OC | On the Surprising Robustness of Sequential Convex Optimization for Contact-Implicit Motion Planning はコメントを受け付けていません

Nonasymptotic Analysis of Stochastic Gradient Descent with the Richardson-Romberg Extrapolation

要約 本論文では、一定のステップサイズを持つ確率的勾配降下(SGD)アルゴリズム … 続きを読む

カテゴリー: 62L20, 93E35, cs.LG, math.OC, stat.ML | Nonasymptotic Analysis of Stochastic Gradient Descent with the Richardson-Romberg Extrapolation はコメントを受け付けていません

Langevin Multiplicative Weights Update with Applications in Polynomial Portfolio Management

要約 本論文では,非凸最適化問題をシンプレックス(より一般的には,シンプレックス … 続きを読む

カテゴリー: cs.LG, math.OC, Non-convex optimization | Langevin Multiplicative Weights Update with Applications in Polynomial Portfolio Management はコメントを受け付けていません

Equivariant Reinforcement Learning Frameworks for Quadrotor Low-Level Control

要約 サンプリング効率と一般化能力の改善は、本質的に不安定な四つ型無人航空機(U … 続きを読む

カテゴリー: cs.RO, math.OC | Equivariant Reinforcement Learning Frameworks for Quadrotor Low-Level Control はコメントを受け付けていません

Unified Feedback Linearization for Nonlinear Systems with Dexterous and Energy-Saving Modes

要約 自由度と比較して多くの入力を備えたシステム(例:Mecanumホイールを備 … 続きを読む

カテゴリー: cs.RO, math.OC | Unified Feedback Linearization for Nonlinear Systems with Dexterous and Energy-Saving Modes はコメントを受け付けていません

Jointly Assigning Processes to Machines and Generating Plans for Autonomous Mobile Robots in a Smart Factory

要約 最新のスマートファクトリーは、プログラム可能な機械のコレクションを使用して … 続きを読む

カテゴリー: cs.RO, math.OC | Jointly Assigning Processes to Machines and Generating Plans for Autonomous Mobile Robots in a Smart Factory はコメントを受け付けていません

Grams: Gradient Descent with Adaptive Momentum Scaling for Training Large Language Models

要約 $ \ mathbf {g} $の放射降下$ \ mathbf {a} $ … 続きを読む

カテゴリー: cs.AI, cs.DS, cs.LG, math.OC | Grams: Gradient Descent with Adaptive Momentum Scaling for Training Large Language Models はコメントを受け付けていません