math.OC」カテゴリーアーカイブ

Improving the convergence of SGD through adaptive batch sizes

要約 ミニバッチ確率的勾配降下法 (SGD) とその変形は、少数のトレーニング例 … 続きを読む

カテゴリー: cs.LG, math.OC, stat.ML | Improving the convergence of SGD through adaptive batch sizes はコメントを受け付けていません

Optimization with Access to Auxiliary Information

要約 我々は、勾配が安価であるか利用可能な補助関数 $h$ へのアクセスを前提と … 続きを読む

カテゴリー: cs.LG, math.OC | Optimization with Access to Auxiliary Information はコメントを受け付けていません

Navigation with shadow prices to optimize multi-commodity flow rates

要約 自律的なマルチエージェントチームに通信ネットワークインフラを提供する手法を … 続きを読む

カテゴリー: cs.RO, math.OC | Navigation with shadow prices to optimize multi-commodity flow rates はコメントを受け付けていません

Extragradient Type Methods for Riemannian Variational Inequality Problems

要約 リーマン凸最適化とミニマックス最適化は、最近かなりの注目を集めています。 … 続きを読む

カテゴリー: cs.LG, math.OC | Extragradient Type Methods for Riemannian Variational Inequality Problems はコメントを受け付けていません

Onion Universe Algorithm: Applications in Weakly Supervised Learning

要約 アンサンブル学習における新しい分類方法である Onion Universe … 続きを読む

カテゴリー: cs.LG, math.OC | Onion Universe Algorithm: Applications in Weakly Supervised Learning はコメントを受け付けていません

Combined sizing and layout optimization of truss structures via update Monte Carlo tree search (UMCTS) algorithm

要約 この研究の主な関心は、サイズとレイアウトの変数を同時に考慮して、トラス構造 … 続きを読む

カテゴリー: cs.AI, math.OC | Combined sizing and layout optimization of truss structures via update Monte Carlo tree search (UMCTS) algorithm はコメントを受け付けていません

Recent Advances in Path Integral Control for Trajectory Optimization: An Overview in Theoretical and Algorithmic Perspectives

要約 この論文では、確率的最適制御と軌道最適化のための経路積分 (PI) 制御ア … 続きを読む

カテゴリー: 13P25, 68T40, cs.RO, cs.SY, eess.SY, G.1.6, math.OC | Recent Advances in Path Integral Control for Trajectory Optimization: An Overview in Theoretical and Algorithmic Perspectives はコメントを受け付けていません

Robust Fitted-Q-Evaluation and Iteration under Sequentially Exogenous Unobserved Confounders

要約 オフライン強化学習は、オンライン実験が費用がかかり、危険または非倫理的であ … 続きを読む

カテゴリー: cs.LG, math.OC, stat.ML | Robust Fitted-Q-Evaluation and Iteration under Sequentially Exogenous Unobserved Confounders はコメントを受け付けていません

State Augmented Constrained Reinforcement Learning: Overcoming the Limitations of Learning with Rewards

要約 制約付き強化学習の一般的な定式化には、特定のしきい値まで個別に蓄積する必要 … 続きを読む

カテゴリー: cs.LG, cs.RO, math.OC | State Augmented Constrained Reinforcement Learning: Overcoming the Limitations of Learning with Rewards はコメントを受け付けていません

A Constructive Approach to Function Realization by Neural Stochastic Differential Equations

要約 ニューラル力学システムによる関数近似の問題は、通常、トップダウン方式でアプ … 続きを読む

カテゴリー: cs.LG, math.OC | A Constructive Approach to Function Realization by Neural Stochastic Differential Equations はコメントを受け付けていません