-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「math.OC」カテゴリーアーカイブ
Sample-Efficient Reinforcement Learning of Koopman eNMPC
要約 強化学習(RL)を使用して、ポリシーの目的関数または状態境界などの制約の動 … 続きを読む
Trial and Trust: Addressing Byzantine Attacks with Comprehensive Defense Strategy
要約 機械学習の最近の進歩により、パフォーマンスが向上し、計算需要が増加していま … 続きを読む
Convergence of Time-Averaged Mean Field Gradient Descent Dynamics for Continuous Multi-Player Zero-Sum Games
要約 平均フィールド相互作用プレーヤーを備えたゼロサムゲームの混合ナッシュ平衡( … 続きを読む
Safe-EF: Error Feedback for Nonsmooth Constrained Optimization
要約 フェデレーション学習は、モデルの更新の高次元により、深刻なコミュニケーショ … 続きを読む
Universal Approximation Theorem for Deep Q-Learning via FBSDE System
要約 ディープQネットワーク(DQNS)の近似能力は、一般的に、ベルマン方程式の … 続きを読む
Efficient Estimation of Relaxed Model Parameters for Robust UAV Trajectory Optimization
要約 オンラインの軌道最適化と最適な制御方法は、農業、環境監視、輸送などの持続可 … 続きを読む
ICNN-enhanced 2SP: Leveraging input convex neural networks for solving two-stage stochastic programming
要約 2段階の確率的プログラミング(2SP)は、不確実性の下での意思決定をモデル … 続きを読む
Operator-Level Quantum Acceleration of Non-Logconcave Sampling
要約 $ \ sigma \ propto e^{ – \ beta … 続きを読む
Multi-objective optimisation via the R2 utilities
要約 多目的最適化の目標は、複数の目標間の可能な限り最高のトレードオフを説明する … 続きを読む
A Two-Timescale Primal-Dual Framework for Reinforcement Learning via Online Dual Variable Guidance
要約 正規化された線形プログラミング定式化の最近の進歩と確率的近似の古典理論を組 … 続きを読む