「math.OC」カテゴリーアーカイブ

A Theoretical Analysis of Optimistic Proximal Policy Optimization in Linear Markov Decision Processes

投稿日: 2023年6月9日作成者: jarxiv

要約近接ポリシー最適化 (PPO) アルゴリズムは、強化学習 (RL) の分野 … 続きを読む →

カテゴリー: cs.AI, cs.LG, math.OC, stat.ML | コメントを受け付けていません

Bayesian Optimization of Expensive Nested Grey-Box Functions

投稿日: 2023年6月9日作成者: jarxiv

要約グレーボックス目的関数、つまりブラックボックス関数とホワイトボックス関数の … 続きを読む →

カテゴリー: cs.AI, cs.LG, math.OC | コメントを受け付けていません

Gradient boosting for convex cone predict and optimize problems

投稿日: 2023年6月8日作成者: jarxiv

要約予測モデルは通常、意思決定の最適化とは独立して最適化されます。スマート予 … 続きを読む →

カテゴリー: cs.LG, math.OC, stat.ML | コメントを受け付けていません

Temporal Difference Learning with Continuous Time and State in the Stochastic Setting

投稿日: 2023年6月8日作成者: jarxiv

要約連続時間政策評価の問題を考える。これは、制御されていない連続時間の確率的 … 続きを読む →

カテゴリー: cs.AI, cs.LG, math.AP, math.OC | コメントを受け付けていません

Smooth Non-Stationary Bandits

投稿日: 2023年6月8日作成者: jarxiv

要約オンライン意思決定の多くのアプリケーションでは、環境は非定常であるため、変 … 続きを読む →

カテゴリー: cs.AI, cs.LG, math.OC, math.ST, stat.TH | コメントを受け付けていません

Faster Gradient-Free Algorithms for Nonsmooth Nonconvex Stochastic Optimization

投稿日: 2023年6月7日作成者: jarxiv

要約 $\min_{x \in \mathbb{R}^d} f(x) \tria … 続きを読む →

カテゴリー: cs.LG, math.OC | コメントを受け付けていません

The Power of Preconditioning in Overparameterized Low-Rank Matrix Sensing

投稿日: 2023年6月7日作成者: jarxiv

要約私たちは、真のランクが不明であり、行列が悪条件である可能性がある場合に、低 … 続きを読む →

カテゴリー: cs.LG, eess.SP, math.OC, stat.ML | コメントを受け付けていません

Convex Risk Bounded Continuous-Time Trajectory Planning and Tube Design in Uncertain Nonconvex Environments

投稿日: 2023年6月6日作成者: jarxiv

要約この論文では、確率的な位置、サイズ、幾何学形状を持つ障害物を含む、不確実な … 続きを読む →

カテゴリー: cs.AI, cs.RO, math.OC | コメントを受け付けていません

Ambiguous Dynamic Treatment Regimes: A Reinforcement Learning Approach

投稿日: 2023年6月6日作成者: jarxiv

要約さまざまな研究における主な研究目標は、観察データセットを使用し、因果関係の … 続きを読む →

カテゴリー: cs.LG, math.OC, math.ST, stat.ML, stat.TH | コメントを受け付けていません

An adaptive safety layer with hard constraints for safe reinforcement learning in multi-energy management systems

投稿日: 2023年6月6日作成者: jarxiv

要約ハードな制約保証を持つ安全な強化学習（RL）は、マルチエネルギー管理システ … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.SY, eess.SY, math.OC | コメントを受け付けていません

「math.OC」カテゴリーアーカイブ

A Theoretical Analysis of Optimistic Proximal Policy Optimization in Linear Markov Decision Processes

Bayesian Optimization of Expensive Nested Grey-Box Functions

Gradient boosting for convex cone predict and optimize problems

Temporal Difference Learning with Continuous Time and State in the Stochastic Setting

Smooth Non-Stationary Bandits

Faster Gradient-Free Algorithms for Nonsmooth Nonconvex Stochastic Optimization

The Power of Preconditioning in Overparameterized Low-Rank Matrix Sensing

Convex Risk Bounded Continuous-Time Trajectory Planning and Tube Design in Uncertain Nonconvex Environments

Ambiguous Dynamic Treatment Regimes: A Reinforcement Learning Approach

An adaptive safety layer with hard constraints for safe reinforcement learning in multi-energy management systems

最近の投稿

最近のコメント

アーカイブ

カテゴリー