-
最近の投稿
- Middle-Layer Representation Alignment for Cross-Lingual Transfer in Fine-Tuned LLMs
- FastTD3: Simple, Fast, and Capable Reinforcement Learning for Humanoid Control
- EXP-Bench: Can AI Conduct AI Research Experiments?
- Dexterous Control of an 11-DOF Redundant Robot for CT-Guided Needle Insertion With Task-Oriented Weighted Policies
- Large-Scale Multi-Robot Coverage Path Planning on Grids with Path Deconfliction
-
最近のコメント
表示できるコメントはありません。 cs.AI (38983) cs.CL (29479) cs.CV (44402) cs.HC (2967) cs.LG (43892) cs.RO (23264) cs.SY (3556) eess.IV (5114) eess.SY (3548) stat.ML (5706)
「math.OC」カテゴリーアーカイブ
Dual Natural Gradient Descent for Scalable Training of Physics-Informed Neural Networks
要約 自然勾配の方法は、物理学に基づいたニューラルネットワーク(PINN)のトレ … 続きを読む
Sequential Resource Trading Using Comparison-Based Gradient Estimation
要約 自律エージェントは、他の自律エージェントや未知の好みを持つ人間と相互作用し … 続きを読む
Situationally-Aware Dynamics Learning
要約 複雑で構造化されていない環境で動作する自律的なロボットは、内部状態と外界の … 続きを読む
A Theoretical Framework for Grokking: Interpolation followed by Riemannian Norm Minimisation
要約 一般的なトレーニングの損失に小さな重量減衰を伴う勾配流のダイナミクスを研究 … 続きを読む
New Perspectives on the Polyak Stepsize: Surrogate Functions and Negative Results
要約 PolyAKの階段化は、凸の最適化における基本的なステップサイズであること … 続きを読む
Beyond Discreteness: Finite-Sample Analysis of Straight-Through Estimator for Quantization
要約 トレーニング量子化されたニューラルネットワークには、基礎となる最適化問題の … 続きを読む
The Polar Express: Optimal Matrix Sign Methods and Their Application to the Muon Algorithm
要約 極性分解と関連するマトリックス記号関数を計算することは、数十年にわたって数 … 続きを読む
Fair Supervised Learning Through Constraints on Smooth Nonconvex Unfairness-Measure Surrogates
要約 公正な監視された機械学習のための新しい戦略が提案されています。 文献の他の … 続きを読む
Sequential QCQP for Bilevel Optimization with Line Search
要約 Bilevelの最適化には、ある問題が別の問題にネストされ、レベル間の複雑 … 続きを読む
Finite sample learning of moving targets
要約 私たちは、サンプルから学ぼうとする動くターゲットを検討します。 私たちの結 … 続きを読む