「math.OC」カテゴリーアーカイブ

Sample-Efficient Reinforcement Learning of Koopman eNMPC

投稿日: 2025年5月14日作成者: jarxiv

要約強化学習（RL）を使用して、ポリシーの目的関数または状態境界などの制約の動 … 続きを読む →

カテゴリー: cs.LG, math.OC | コメントを受け付けていません

Trial and Trust: Addressing Byzantine Attacks with Comprehensive Defense Strategy

投稿日: 2025年5月13日作成者: jarxiv

要約機械学習の最近の進歩により、パフォーマンスが向上し、計算需要が増加していま … 続きを読む →

カテゴリー: cs.LG, math.OC | コメントを受け付けていません

Convergence of Time-Averaged Mean Field Gradient Descent Dynamics for Continuous Multi-Player Zero-Sum Games

投稿日: 2025年5月13日作成者: jarxiv

要約平均フィールド相互作用プレーヤーを備えたゼロサムゲームの混合ナッシュ平衡（ … 続きを読む →

カテゴリー: 35Q89, 49N80, 90C47, 91A16, cs.LG, math.AP, math.OC, math.PR, stat.ML | コメントを受け付けていません

Safe-EF: Error Feedback for Nonsmooth Constrained Optimization

投稿日: 2025年5月12日作成者: jarxiv

要約フェデレーション学習は、モデルの更新の高次元により、深刻なコミュニケーショ … 続きを読む →

カテゴリー: cs.LG, math.OC, stat.ML | コメントを受け付けていません

Universal Approximation Theorem for Deep Q-Learning via FBSDE System

投稿日: 2025年5月12日作成者: jarxiv

要約ディープQネットワーク（DQNS）の近似能力は、一般的に、ベルマン方程式の … 続きを読む →

カテゴリー: cs.AI, cs.LG, math.OC | コメントを受け付けていません

Efficient Estimation of Relaxed Model Parameters for Robust UAV Trajectory Optimization

投稿日: 2025年5月9日作成者: jarxiv

要約オンラインの軌道最適化と最適な制御方法は、農業、環境監視、輸送などの持続可 … 続きを読む →

カテゴリー: (Primary), cs.RO, cs.SY, eess.SY, math.OC | コメントを受け付けていません

ICNN-enhanced 2SP: Leveraging input convex neural networks for solving two-stage stochastic programming

投稿日: 2025年5月9日作成者: jarxiv

要約 2段階の確率的プログラミング（2SP）は、不確実性の下での意思決定をモデル … 続きを読む →

カテゴリー: cs.LG, math.OC | コメントを受け付けていません

Operator-Level Quantum Acceleration of Non-Logconcave Sampling

投稿日: 2025年5月9日作成者: jarxiv

要約 $ \ sigma \ propto e^{ – \ beta … 続きを読む →

カテゴリー: cs.LG, math.OC, quant-ph | コメントを受け付けていません

Multi-objective optimisation via the R2 utilities

投稿日: 2025年5月9日作成者: jarxiv

要約多目的最適化の目標は、複数の目標間の可能な限り最高のトレードオフを説明する … 続きを読む →

カテゴリー: cs.LG, math.OC, stat.ML | コメントを受け付けていません

A Two-Timescale Primal-Dual Framework for Reinforcement Learning via Online Dual Variable Guidance

投稿日: 2025年5月8日作成者: jarxiv

要約正規化された線形プログラミング定式化の最近の進歩と確率的近似の古典理論を組 … 続きを読む →

カテゴリー: cs.LG, math.OC | コメントを受け付けていません

「math.OC」カテゴリーアーカイブ

Sample-Efficient Reinforcement Learning of Koopman eNMPC

Trial and Trust: Addressing Byzantine Attacks with Comprehensive Defense Strategy

Convergence of Time-Averaged Mean Field Gradient Descent Dynamics for Continuous Multi-Player Zero-Sum Games

Safe-EF: Error Feedback for Nonsmooth Constrained Optimization

Universal Approximation Theorem for Deep Q-Learning via FBSDE System

Efficient Estimation of Relaxed Model Parameters for Robust UAV Trajectory Optimization

ICNN-enhanced 2SP: Leveraging input convex neural networks for solving two-stage stochastic programming

Operator-Level Quantum Acceleration of Non-Logconcave Sampling

Multi-objective optimisation via the R2 utilities

A Two-Timescale Primal-Dual Framework for Reinforcement Learning via Online Dual Variable Guidance

最近の投稿

最近のコメント

アーカイブ

カテゴリー