-
最近の投稿
- Enhancing Efficiency in Multidevice Federated Learning through Data Selection
- RadarTrack: Enhancing Ego-Vehicle Speed Estimation with Single-chip mmWave Radar
- HOPE: A Reinforcement Learning-based Hybrid Policy Path Planner for Diverse Parking Scenarios
- From Imitation to Exploration: End-to-end Autonomous Driving based on World Model
- LLM-Enabled In-Context Learning for Data Collection Scheduling in UAV-assisted Sensor Networks
-
最近のコメント
表示できるコメントはありません。 cs.AI (36903) cs.CL (27936) cs.CV (42678) cs.HC (2822) cs.LG (41843) cs.RO (21845) cs.SY (3324) eess.IV (4979) eess.SY (3316) stat.ML (5475)
「math.OC」カテゴリーアーカイブ
Reusing Historical Trajectories in Natural Policy Gradient via Importance Sampling: Convergence and Convergence Rate
要約 強化学習は、学習ベースの制御のための数学的枠組みを提供します。その成功は、 … 続きを読む
Online Scheduling for LLM Inference with KV Cache Constraints
要約 トレーニングされたモデルがユーザープロンプトに応じて一度に1つの単語を生成 … 続きを読む
On Separation Between Best-Iterate, Random-Iterate, and Last-Iterate Convergence of Learning in Games
要約 ゲームにおける学習ダイナミクスの非エルゴディック収束は、理論と実践の両方に … 続きを読む
On the Surprising Robustness of Sequential Convex Optimization for Contact-Implicit Motion Planning
要約 接触-暗示的運動計画-暗黙の相補性制約として接触順序を組み込む-は、新しい … 続きを読む
Nonasymptotic Analysis of Stochastic Gradient Descent with the Richardson-Romberg Extrapolation
要約 本論文では、一定のステップサイズを持つ確率的勾配降下(SGD)アルゴリズム … 続きを読む
Langevin Multiplicative Weights Update with Applications in Polynomial Portfolio Management
要約 本論文では,非凸最適化問題をシンプレックス(より一般的には,シンプレックス … 続きを読む
カテゴリー: cs.LG, math.OC, Non-convex optimization
Langevin Multiplicative Weights Update with Applications in Polynomial Portfolio Management はコメントを受け付けていません
Equivariant Reinforcement Learning Frameworks for Quadrotor Low-Level Control
要約 サンプリング効率と一般化能力の改善は、本質的に不安定な四つ型無人航空機(U … 続きを読む
Unified Feedback Linearization for Nonlinear Systems with Dexterous and Energy-Saving Modes
要約 自由度と比較して多くの入力を備えたシステム(例:Mecanumホイールを備 … 続きを読む
Jointly Assigning Processes to Machines and Generating Plans for Autonomous Mobile Robots in a Smart Factory
要約 最新のスマートファクトリーは、プログラム可能な機械のコレクションを使用して … 続きを読む