math.OC」カテゴリーアーカイブ

A Method to Improve the Performance of Reinforcement Learning Based on the Y Operator for a Class of Stochastic Differential Equation-Based Child-Mother Systems

要約 この論文では、確率微分方程式(SDE)によって支配されるシステムに対するA … 続きを読む

カテゴリー: cs.AI, math.OC | A Method to Improve the Performance of Reinforcement Learning Based on the Y Operator for a Class of Stochastic Differential Equation-Based Child-Mother Systems はコメントを受け付けていません

Decision-focused predictions via pessimistic bilevel optimization: a computational study

要約 最適化パラメータの不確実性への対処は、長年にわたる重要な課題です。 通常、 … 続きを読む

カテゴリー: 90C30, cs.LG, math.OC | Decision-focused predictions via pessimistic bilevel optimization: a computational study はコメントを受け付けていません

On the Robustness of Decision-Focused Learning

要約 意思決定焦点学習 (DFL) は、不完全な最適化問題の欠落パラメーターを予 … 続きを読む

カテゴリー: 68Txx, cs.LG, math.OC | On the Robustness of Decision-Focused Learning はコメントを受け付けていません

Cumulative Regret Analysis of the Piyavskii–Shubert Algorithm and Its Variants for Global Optimization

要約 私たちは大域的最適化の問題を研究し、Piyavskii-Shubert ア … 続きを読む

カテゴリー: cs.LG, math.OC | Cumulative Regret Analysis of the Piyavskii–Shubert Algorithm and Its Variants for Global Optimization はコメントを受け付けていません

Symmetry Breaking in Symmetric Tensor Decomposition

要約 このノートでは、対称テンソルのランク分解の計算に関連する高度に非凸の最適化 … 続きを読む

カテゴリー: cs.LG, math.OC | Symmetry Breaking in Symmetric Tensor Decomposition はコメントを受け付けていません

Resilient Constrained Reinforcement Learning

要約 私たちは、トレーニング前に複数の制約仕様が識別されない、制約付き強化学習 … 続きを読む

カテゴリー: cs.LG, cs.SY, eess.SY, math.OC | Resilient Constrained Reinforcement Learning はコメントを受け付けていません

Bayesian Design Principles for Frequentist Sequential Learning

要約 我々は、効率的なバンディット学習アルゴリズムと強化学習アルゴリズムを統一ベ … 続きを読む

カテゴリー: cs.LG, math.OC, math.ST, stat.TH | Bayesian Design Principles for Frequentist Sequential Learning はコメントを受け付けていません

Implicitly normalized forecaster with clipping for linear and non-linear heavy-tailed multi-armed bandits

要約 Implicitly Normalized Forecaster (INF … 続きを読む

カテゴリー: cs.LG, math.OC, stat.ML | Implicitly normalized forecaster with clipping for linear and non-linear heavy-tailed multi-armed bandits はコメントを受け付けていません

Bayesian Design Principles for Frequentist Sequential Learning

要約 我々は、効率的なバンディット学習アルゴリズムと強化学習アルゴリズムを統一ベ … 続きを読む

カテゴリー: cs.LG, math.OC, math.ST, stat.TH | Bayesian Design Principles for Frequentist Sequential Learning はコメントを受け付けていません

Bridging the Gaps: Learning Verifiable Model-Free Quadratic Programming Controllers Inspired by Model Predictive Control

要約 このペーパーでは、モデル予測制御 (MPC) からインスピレーションを得た … 続きを読む

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY, math.OC | Bridging the Gaps: Learning Verifiable Model-Free Quadratic Programming Controllers Inspired by Model Predictive Control はコメントを受け付けていません