math.OC」カテゴリーアーカイブ

New Perspectives on the Polyak Stepsize: Surrogate Functions and Negative Results

要約 PolyAKの階段化は、凸の最適化における基本的なステップサイズであること … 続きを読む

カテゴリー: cs.LG, math.OC | コメントする

Beyond Discreteness: Finite-Sample Analysis of Straight-Through Estimator for Quantization

要約 トレーニング量子化されたニューラルネットワークには、基礎となる最適化問題の … 続きを読む

カテゴリー: cs.LG, math.OC | コメントする

The Polar Express: Optimal Matrix Sign Methods and Their Application to the Muon Algorithm

要約 極性分解と関連するマトリックス記号関数を計算することは、数十年にわたって数 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.NA, math.NA, math.OC | コメントする

Fair Supervised Learning Through Constraints on Smooth Nonconvex Unfairness-Measure Surrogates

要約 公正な監視された機械学習のための新しい戦略が提案されています。 文献の他の … 続きを読む

カテゴリー: cs.LG, math.OC | コメントする

Sequential QCQP for Bilevel Optimization with Line Search

要約 Bilevelの最適化には、ある問題が別の問題にネストされ、レベル間の複雑 … 続きを読む

カテゴリー: cs.LG, cs.SY, eess.SY, math.OC | Sequential QCQP for Bilevel Optimization with Line Search はコメントを受け付けていません

Finite sample learning of moving targets

要約 私たちは、サンプルから学ぼうとする動くターゲットを検討します。 私たちの結 … 続きを読む

カテゴリー: cs.LG, math.OC | Finite sample learning of moving targets はコメントを受け付けていません

Quantum Optimization via Gradient-Based Hamiltonian Descent

要約 機械学習の急速な進歩により、計算効率と低メモリ要件により、最新の最適化技術 … 続きを読む

カテゴリー: cs.LG, math.OC, quant-ph | Quantum Optimization via Gradient-Based Hamiltonian Descent はコメントを受け付けていません

Online Scheduling for LLM Inference with KV Cache Constraints

要約 トレーニングされたモデルがユーザープロンプトに応じて一度に1つの単語を生成 … 続きを読む

カテゴリー: cs.AI, cs.LG, math.OC | Online Scheduling for LLM Inference with KV Cache Constraints はコメントを受け付けていません

Nesterov Acceleration for Ensemble Kalman Inversion and Variants

要約 アンサンブルKalman Inversion(EKI)は、逆の問題を解決す … 続きを読む

カテゴリー: cs.LG, math.OC, stat.CO | Nesterov Acceleration for Ensemble Kalman Inversion and Variants はコメントを受け付けていません

Gluon: Making Muon & Scion Great Again! (Bridging Theory and Practice of LMO-based Optimizers for LLMs)

要約 深い学習最適化の最近の開発により、$ \ sf muon $や$ \ sf … 続きを読む

カテゴリー: cs.LG, math.OC, stat.ML | Gluon: Making Muon & Scion Great Again! (Bridging Theory and Practice of LMO-based Optimizers for LLMs) はコメントを受け付けていません