-
最近の投稿
- A Systematic Approach to Design Real-World Human-in-the-Loop Deep Reinforcement Learning: Salient Features, Challenges and Trade-offs
- Robo-Troj: Attacking LLM-based Task Planners
- SE(3)-Equivariant Robot Learning and Control: A Tutorial Survey
- Geometric Formulation of Unified Force-Impedance Control on SE(3) for Robotic Manipulators
- Subframework-based Bearing Rigidity Maintenance Control in Multirobot Networks
-
最近のコメント
表示できるコメントはありません。 cs.AI (37106) cs.CL (28087) cs.CV (42847) cs.HC (2837) cs.LG (42044) cs.RO (21987) cs.SY (3355) eess.IV (4990) eess.SY (3347) stat.ML (5498)
「math.OC」カテゴリーアーカイブ
Optimistic Online Learning in Symmetric Cone Games
要約 最適化オンライン学習アルゴリズムにより、特に2人零和ゲームの均衡計算が大き … 続きを読む
Quantum Speedups for Markov Chain Monte Carlo Methods with Application to Optimization
要約 我々は、ポテンシャル関数を$f$とする確率分布からのサンプリングによく用い … 続きを読む
Deterministic Policy Gradient Primal-Dual Methods for Continuous-Space Constrained MDPs
要約 本研究では、制約付き力学系で広く遭遇する、連続的な状態・行動空間を持つ制約 … 続きを読む
Solving the Paint Shop Problem with Flexible Management of Multi-Lane Buffers Using Reinforcement Learning and Action Masking
要約 ペイントショップの問題では、異なる色に割り当てられた車の順序のない入庫順序 … 続きを読む
Integrating Human Knowledge Through Action Masking in Reinforcement Learning for Operations Research
要約 強化学習(RL)は、オペレーションズ・リサーチにおける問題に対処するための … 続きを読む
A Tutorial on Distributed Optimization for Cooperative Robotics: from Setups and Algorithms to Toolboxes and Research Directions
要約 マルチロボットシステムのいくつかの興味深い問題は、分散最適化のフレームワー … 続きを読む
Dynamics-aware Diffusion Models for Planning and Control
要約 このペーパーでは、特に環境が複雑で、システムのダイナミクスが実用的なアプリ … 続きを読む
A Randomized Zeroth-Order Hierarchical Framework for Heterogeneous Federated Learning
要約 フェデレートラーニング(FL)の不均一性は、モデルのパフォーマンスと収束に … 続きを読む
$p$-Adic Polynomial Regression as Alternative to Neural Network for Approximating $p$-Adic Functions of Many Variables
要約 連続関数を近似する方法$ \ mathbb {z} _ {p}^{n} \ … 続きを読む