math.OC」カテゴリーアーカイブ

Optimistic Online Learning in Symmetric Cone Games

要約 最適化オンライン学習アルゴリズムにより、特に2人零和ゲームの均衡計算が大き … 続きを読む

カテゴリー: cs.GT, cs.LG, math.OC | Optimistic Online Learning in Symmetric Cone Games はコメントを受け付けていません

Quantum Speedups for Markov Chain Monte Carlo Methods with Application to Optimization

要約 我々は、ポテンシャル関数を$f$とする確率分布からのサンプリングによく用い … 続きを読む

カテゴリー: cs.LG, math.OC, quant-ph | Quantum Speedups for Markov Chain Monte Carlo Methods with Application to Optimization はコメントを受け付けていません

Deterministic Policy Gradient Primal-Dual Methods for Continuous-Space Constrained MDPs

要約 本研究では、制約付き力学系で広く遭遇する、連続的な状態・行動空間を持つ制約 … 続きを読む

カテゴリー: cs.AI, math.OC | Deterministic Policy Gradient Primal-Dual Methods for Continuous-Space Constrained MDPs はコメントを受け付けていません

Solving the Paint Shop Problem with Flexible Management of Multi-Lane Buffers Using Reinforcement Learning and Action Masking

要約 ペイントショップの問題では、異なる色に割り当てられた車の順序のない入庫順序 … 続きを読む

カテゴリー: cs.LG, math.OC | Solving the Paint Shop Problem with Flexible Management of Multi-Lane Buffers Using Reinforcement Learning and Action Masking はコメントを受け付けていません

Integrating Human Knowledge Through Action Masking in Reinforcement Learning for Operations Research

要約 強化学習(RL)は、オペレーションズ・リサーチにおける問題に対処するための … 続きを読む

カテゴリー: cs.LG, math.OC | Integrating Human Knowledge Through Action Masking in Reinforcement Learning for Operations Research はコメントを受け付けていません

A Tutorial on Distributed Optimization for Cooperative Robotics: from Setups and Algorithms to Toolboxes and Research Directions

要約 マルチロボットシステムのいくつかの興味深い問題は、分散最適化のフレームワー … 続きを読む

カテゴリー: cs.RO, math.OC | A Tutorial on Distributed Optimization for Cooperative Robotics: from Setups and Algorithms to Toolboxes and Research Directions はコメントを受け付けていません

Dynamics-aware Diffusion Models for Planning and Control

要約 このペーパーでは、特に環境が複雑で、システムのダイナミクスが実用的なアプリ … 続きを読む

カテゴリー: cs.RO, math.OC | Dynamics-aware Diffusion Models for Planning and Control はコメントを受け付けていません

A Randomized Zeroth-Order Hierarchical Framework for Heterogeneous Federated Learning

要約 フェデレートラーニング(FL)の不均一性は、モデルのパフォーマンスと収束に … 続きを読む

カテゴリー: cs.LG, math.OC | A Randomized Zeroth-Order Hierarchical Framework for Heterogeneous Federated Learning はコメントを受け付けていません

$p$-Adic Polynomial Regression as Alternative to Neural Network for Approximating $p$-Adic Functions of Many Variables

要約 連続関数を近似する方法$ \ mathbb {z} _ {p}^{n} \ … 続きを読む

カテゴリー: cs.LG, cs.NA, math-ph, math.MP, math.NA, math.NT, math.OC | $p$-Adic Polynomial Regression as Alternative to Neural Network for Approximating $p$-Adic Functions of Many Variables はコメントを受け付けていません

A stochastic gradient descent algorithm with random search directions

要約 確率的座標降下アルゴリズムは、現在の反復から値でほとんどの座標を修正し、残 … 続きを読む

カテゴリー: cs.LG, math.OC, math.PR, stat.ML | A stochastic gradient descent algorithm with random search directions はコメントを受け付けていません