「math.OC」カテゴリーアーカイブ

A Stability Principle for Learning under Non-Stationarity

投稿日: 2024年10月10日作成者: jarxiv

要約私たちは、非定常環境における統計学習のための多用途のフレームワークを開発し … 続きを読む →

カテゴリー: 68T05, 90C15, cs.AI, cs.LG, math.OC, stat.ML | コメントを受け付けていません

A Simulation-Free Deep Learning Approach to Stochastic Optimal Control

投稿日: 2024年10月10日作成者: jarxiv

要約確率的最適制御 (SOC) における一般的な問題を解決するためのシミュレー … 続きを読む →

カテゴリー: cs.LG, math.OC | コメントを受け付けていません

A Simulation-Free Deep Learning Approach to Stochastic Optimal Control

投稿日: 2024年10月8日作成者: jarxiv

要約確率的最適制御 (SOC) における一般的な問題を解決するためのシミュレー … 続きを読む →

カテゴリー: cs.LG, math.OC | コメントを受け付けていません

Online Convex Optimization with a Separation Oracle

投稿日: 2024年10月8日作成者: jarxiv

要約この論文では、分離ベースのアルゴリズムの中で最先端のリグアランス保証を備え … 続きを読む →

カテゴリー: cs.LG, math.OC | コメントを受け付けていません

Unichain and Aperiodicity are Sufficient for Asymptotic Optimality of Average-Reward Restless Bandits

投稿日: 2024年10月4日作成者: jarxiv

要約我々は、離散時間における無限地平の平均報酬型レストレス・バンディット問題を … 続きを読む →

カテゴリー: 90C40, cs.LG, G.3, math.OC, math.PR | コメントを受け付けていません

A Parallel-in-Time Newton’s Method for Nonlinear Model Predictive Control

投稿日: 2024年10月3日作成者: jarxiv

要約モデル予測制御 (MPC) は、動的システムを最適に制御するための強力なフ … 続きを読む →

カテゴリー: cs.RO, cs.SY, eess.SY, math.OC | コメントを受け付けていません

Almost Sure Convergence of Average Reward Temporal Difference Learning

投稿日: 2024年10月3日作成者: jarxiv

要約表形式の平均報酬時間差 (TD) 学習は、平均報酬強化学習においておそらく … 続きを読む →

カテゴリー: cs.AI, cs.LG, math.OC, stat.ML | コメントを受け付けていません

FLeNS: Federated Learning with Enhanced Nesterov-Newton Sketch

投稿日: 2024年10月2日作成者: jarxiv

要約フェデレーテッドラーニングは、特に 2 次メソッドの場合、通信効率と迅速 … 続きを読む →

カテゴリー: C.1.4, cs.CV, cs.DC, cs.LG, math.OC | コメントを受け付けていません

A Parallel-in-Time Newton’s Method for Nonlinear Model Predictive Control

投稿日: 2024年10月1日作成者: jarxiv

要約モデル予測制御 (MPC) は、動的システムを最適に制御するための強力なフ … 続きを読む →

カテゴリー: cs.RO, cs.SY, eess.SY, math.OC | コメントを受け付けていません

It begins with a boundary: A geometric view on probabilistically robust learning

投稿日: 2024年10月1日作成者: jarxiv

要約ディープニューラルネットワークは、多くの分類タスクで超人間的なパフォー … 続きを読む →

カテゴリー: cs.LG, math.AP, math.OC, stat.ML | コメントを受け付けていません

「math.OC」カテゴリーアーカイブ

A Stability Principle for Learning under Non-Stationarity

A Simulation-Free Deep Learning Approach to Stochastic Optimal Control

A Simulation-Free Deep Learning Approach to Stochastic Optimal Control

Online Convex Optimization with a Separation Oracle

Unichain and Aperiodicity are Sufficient for Asymptotic Optimality of Average-Reward Restless Bandits

A Parallel-in-Time Newton’s Method for Nonlinear Model Predictive Control

Almost Sure Convergence of Average Reward Temporal Difference Learning

FLeNS: Federated Learning with Enhanced Nesterov-Newton Sketch

A Parallel-in-Time Newton’s Method for Nonlinear Model Predictive Control

It begins with a boundary: A geometric view on probabilistically robust learning

最近の投稿

最近のコメント

アーカイブ

カテゴリー