math.OC」カテゴリーアーカイブ

Sample-Efficient Reinforcement Learning of Koopman eNMPC

要約 強化学習(RL)を使用して、ポリシーの目的関数または状態境界などの制約の動 … 続きを読む

カテゴリー: cs.LG, math.OC | Sample-Efficient Reinforcement Learning of Koopman eNMPC はコメントを受け付けていません

Trial and Trust: Addressing Byzantine Attacks with Comprehensive Defense Strategy

要約 機械学習の最近の進歩により、パフォーマンスが向上し、計算需要が増加していま … 続きを読む

カテゴリー: cs.LG, math.OC | Trial and Trust: Addressing Byzantine Attacks with Comprehensive Defense Strategy はコメントを受け付けていません

Convergence of Time-Averaged Mean Field Gradient Descent Dynamics for Continuous Multi-Player Zero-Sum Games

要約 平均フィールド相互作用プレーヤーを備えたゼロサムゲームの混合ナッシュ平衡( … 続きを読む

カテゴリー: 35Q89, 49N80, 90C47, 91A16, cs.LG, math.AP, math.OC, math.PR, stat.ML | Convergence of Time-Averaged Mean Field Gradient Descent Dynamics for Continuous Multi-Player Zero-Sum Games はコメントを受け付けていません

Safe-EF: Error Feedback for Nonsmooth Constrained Optimization

要約 フェデレーション学習は、モデルの更新の高次元により、深刻なコミュニケーショ … 続きを読む

カテゴリー: cs.LG, math.OC, stat.ML | Safe-EF: Error Feedback for Nonsmooth Constrained Optimization はコメントを受け付けていません

Universal Approximation Theorem for Deep Q-Learning via FBSDE System

要約 ディープQネットワーク(DQNS)の近似能力は、一般的に、ベルマン方程式の … 続きを読む

カテゴリー: cs.AI, cs.LG, math.OC | Universal Approximation Theorem for Deep Q-Learning via FBSDE System はコメントを受け付けていません

Efficient Estimation of Relaxed Model Parameters for Robust UAV Trajectory Optimization

要約 オンラインの軌道最適化と最適な制御方法は、農業、環境監視、輸送などの持続可 … 続きを読む

カテゴリー: (Primary), cs.RO, cs.SY, eess.SY, math.OC | Efficient Estimation of Relaxed Model Parameters for Robust UAV Trajectory Optimization はコメントを受け付けていません

ICNN-enhanced 2SP: Leveraging input convex neural networks for solving two-stage stochastic programming

要約 2段階の確率的プログラミング(2SP)は、不確実性の下での意思決定をモデル … 続きを読む

カテゴリー: cs.LG, math.OC | ICNN-enhanced 2SP: Leveraging input convex neural networks for solving two-stage stochastic programming はコメントを受け付けていません

Operator-Level Quantum Acceleration of Non-Logconcave Sampling

要約 $ \ sigma \ propto e^{ – \ beta … 続きを読む

カテゴリー: cs.LG, math.OC, quant-ph | Operator-Level Quantum Acceleration of Non-Logconcave Sampling はコメントを受け付けていません

Multi-objective optimisation via the R2 utilities

要約 多目的最適化の目標は、複数の目標間の可能な限り最高のトレードオフを説明する … 続きを読む

カテゴリー: cs.LG, math.OC, stat.ML | Multi-objective optimisation via the R2 utilities はコメントを受け付けていません

A Two-Timescale Primal-Dual Framework for Reinforcement Learning via Online Dual Variable Guidance

要約 正規化された線形プログラミング定式化の最近の進歩と確率的近似の古典理論を組 … 続きを読む

カテゴリー: cs.LG, math.OC | A Two-Timescale Primal-Dual Framework for Reinforcement Learning via Online Dual Variable Guidance はコメントを受け付けていません