math.OC」カテゴリーアーカイブ

Online Newton Method for Bandit Convex Optimisation

要約 ゼロ次バンディット凸最適化のための計算効率の高いアルゴリズムを導入し、敵対 … 続きを読む

カテゴリー: cs.LG, math.OC, stat.ML | Online Newton Method for Bandit Convex Optimisation はコメントを受け付けていません

Random Features Approximation for Control-Affine Systems

要約 最新のデータ駆動型制御アプリケーションには、原理に基づいたコントローラー合 … 続きを読む

カテゴリー: cs.LG, cs.SY, eess.SY, math.OC, stat.ML | Random Features Approximation for Control-Affine Systems はコメントを受け付けていません

Training Dynamics of Multi-Head Softmax Attention for In-Context Learning: Emergence, Convergence, and Optimality

要約 マルチタスク線形回帰のインコンテキスト学習のためのマルチヘッド ソフトマッ … 続きを読む

カテゴリー: cs.AI, cs.LG, math.OC, math.ST, stat.ML, stat.TH | Training Dynamics of Multi-Head Softmax Attention for In-Context Learning: Emergence, Convergence, and Optimality はコメントを受け付けていません

A Guide to Stochastic Optimisation for Large-Scale Inverse Problems

要約 確率的最適化アルゴリズムは、大量のデータを使用した機械学習の事実上の標準で … 続きを読む

カテゴリー: cs.CV, cs.NA, math.NA, math.OC | A Guide to Stochastic Optimisation for Large-Scale Inverse Problems はコメントを受け付けていません

Decentralized Personalized Federated Learning

要約 この研究では、分散型フェデレーテッド ラーニングにおけるデータの異質性と通 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MA, math.OC | Decentralized Personalized Federated Learning はコメントを受け付けていません

Threshold Decision-Making Dynamics Adaptive to Physical Constraints and Changing Environment

要約 我々は、2 つの空間タスク間を切り替えるエージェントの物理的ダイナミクスを … 続きを読む

カテゴリー: cs.RO, math.DS, math.OC | Threshold Decision-Making Dynamics Adaptive to Physical Constraints and Changing Environment はコメントを受け付けていません

Dealing with unbounded gradients in stochastic saddle-point optimization

要約 凸凹関数の鞍点を見つけるための確率的一次法の性能を研究します。 このような … 続きを読む

カテゴリー: cs.LG, math.OC, stat.ML | Dealing with unbounded gradients in stochastic saddle-point optimization はコメントを受け付けていません

Gradient Descent on Logistic Regression with Non-Separable Data and Large Step Sizes

要約 私たちは、大きく一定のステップ サイズを使用したロジスティック回帰問題に関 … 続きを読む

カテゴリー: cs.LG, math.OC | Gradient Descent on Logistic Regression with Non-Separable Data and Large Step Sizes はコメントを受け付けていません

Learning mirror maps in policy mirror descent

要約 Policy Mirror Descent (PMD) は強化学習で人気の … 続きを読む

カテゴリー: cs.LG, math.OC, stat.ML | Learning mirror maps in policy mirror descent はコメントを受け付けていません

Robust Reward Design for Markov Decision Processes

要約 報酬設計の問題では、リーダーとフォロワーの間の相互作用を調べます。リーダー … 続きを読む

カテゴリー: cs.AI, cs.GT, math.OC | Robust Reward Design for Markov Decision Processes はコメントを受け付けていません