-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「math.OC」カテゴリーアーカイブ
A Theoretical Analysis of Optimistic Proximal Policy Optimization in Linear Markov Decision Processes
要約 近接ポリシー最適化 (PPO) アルゴリズムは、強化学習 (RL) の分野 … 続きを読む
Bayesian Optimization of Expensive Nested Grey-Box Functions
要約 グレーボックス目的関数、つまりブラックボックス関数とホワイトボックス関数の … 続きを読む
Gradient boosting for convex cone predict and optimize problems
要約 予測モデルは通常、意思決定の最適化とは独立して最適化されます。 スマート予 … 続きを読む
Temporal Difference Learning with Continuous Time and State in the Stochastic Setting
要約 連続時間政策評価の問題を考える。 これは、制御されていない連続時間の確率的 … 続きを読む
Smooth Non-Stationary Bandits
要約 オンライン意思決定の多くのアプリケーションでは、環境は非定常であるため、変 … 続きを読む
Faster Gradient-Free Algorithms for Nonsmooth Nonconvex Stochastic Optimization
要約 $\min_{x \in \mathbb{R}^d} f(x) \tria … 続きを読む
The Power of Preconditioning in Overparameterized Low-Rank Matrix Sensing
要約 私たちは、真のランクが不明であり、行列が悪条件である可能性がある場合に、低 … 続きを読む
Convex Risk Bounded Continuous-Time Trajectory Planning and Tube Design in Uncertain Nonconvex Environments
要約 この論文では、確率的な位置、サイズ、幾何学形状を持つ障害物を含む、不確実な … 続きを読む
Ambiguous Dynamic Treatment Regimes: A Reinforcement Learning Approach
要約 さまざまな研究における主な研究目標は、観察データセットを使用し、因果関係の … 続きを読む
An adaptive safety layer with hard constraints for safe reinforcement learning in multi-energy management systems
要約 ハードな制約保証を持つ安全な強化学習(RL)は、マルチエネルギー管理システ … 続きを読む