math.OC」カテゴリーアーカイブ

A Stability Principle for Learning under Non-Stationarity

要約 私たちは、非定常環境における統計学習のための多用途のフレームワークを開発し … 続きを読む

カテゴリー: 68T05, 90C15, cs.AI, cs.LG, math.OC, stat.ML | A Stability Principle for Learning under Non-Stationarity はコメントを受け付けていません

A Simulation-Free Deep Learning Approach to Stochastic Optimal Control

要約 確率的最適制御 (SOC) における一般的な問題を解決するためのシミュレー … 続きを読む

カテゴリー: cs.LG, math.OC | A Simulation-Free Deep Learning Approach to Stochastic Optimal Control はコメントを受け付けていません

A Simulation-Free Deep Learning Approach to Stochastic Optimal Control

要約 確率的最適制御 (SOC) における一般的な問題を解決するためのシミュレー … 続きを読む

カテゴリー: cs.LG, math.OC | A Simulation-Free Deep Learning Approach to Stochastic Optimal Control はコメントを受け付けていません

Online Convex Optimization with a Separation Oracle

要約 この論文では、分離ベースのアルゴリズムの中で最先端のリグアランス保証を備え … 続きを読む

カテゴリー: cs.LG, math.OC | Online Convex Optimization with a Separation Oracle はコメントを受け付けていません

Unichain and Aperiodicity are Sufficient for Asymptotic Optimality of Average-Reward Restless Bandits

要約 我々は、離散時間における無限地平の平均報酬型レストレス・バンディット問題を … 続きを読む

カテゴリー: 90C40, cs.LG, G.3, math.OC, math.PR | Unichain and Aperiodicity are Sufficient for Asymptotic Optimality of Average-Reward Restless Bandits はコメントを受け付けていません

A Parallel-in-Time Newton’s Method for Nonlinear Model Predictive Control

要約 モデル予測制御 (MPC) は、動的システムを最適に制御するための強力なフ … 続きを読む

カテゴリー: cs.RO, cs.SY, eess.SY, math.OC | A Parallel-in-Time Newton’s Method for Nonlinear Model Predictive Control はコメントを受け付けていません

Almost Sure Convergence of Average Reward Temporal Difference Learning

要約 表形式の平均報酬時間差 (TD) 学習は、平均報酬強化学習においておそらく … 続きを読む

カテゴリー: cs.AI, cs.LG, math.OC, stat.ML | Almost Sure Convergence of Average Reward Temporal Difference Learning はコメントを受け付けていません

FLeNS: Federated Learning with Enhanced Nesterov-Newton Sketch

要約 フェデレーテッド ラーニングは、特に 2 次メソッドの場合、通信効率と迅速 … 続きを読む

カテゴリー: C.1.4, cs.CV, cs.DC, cs.LG, math.OC | FLeNS: Federated Learning with Enhanced Nesterov-Newton Sketch はコメントを受け付けていません

A Parallel-in-Time Newton’s Method for Nonlinear Model Predictive Control

要約 モデル予測制御 (MPC) は、動的システムを最適に制御するための強力なフ … 続きを読む

カテゴリー: cs.RO, cs.SY, eess.SY, math.OC | A Parallel-in-Time Newton’s Method for Nonlinear Model Predictive Control はコメントを受け付けていません

It begins with a boundary: A geometric view on probabilistically robust learning

要約 ディープ ニューラル ネットワークは、多くの分類タスクで超人間的なパフォー … 続きを読む

カテゴリー: cs.LG, math.AP, math.OC, stat.ML | It begins with a boundary: A geometric view on probabilistically robust learning はコメントを受け付けていません